Google - Google en PDF-bestanden


PDFMisschien heb je wel PDF-bestanden op je website staan dan is het handig om te weten dat Google deze bestanden ook kan indexeren. In 2001 begon Google met het indexeren van PDF-bestanden en inmiddels zijn honderden miljoenen bestanden ge´ndexeerd door de zoekmachine en opduiken in de zoekresultaten.

Om een PDF goed te laten indexeren is het belangrijk om aan een aantal punten te denken. Als eerste zijn dat de bestandseigenschappen die ingevuld moeten worden. Het gaat dan onder andere om de Titel, Onderwerp, Keywords en Auteur. Geef daarnaast ook de bestandsnaam een omschrijvende titel zoals je dit ook zou doen voor pagina's.

Zet de belangrijkste tekst van het document bovenaan, goed voor zowel de lezers als voor de zoekmachines. Belangrijk is uiteraard ook om duplicate content te voorkomen. Zorg ervoor dat de inhoud van een PDF dus niet ook op een pagina staat.

Selecteren

Zorg tevens dat er niet allerlei beveiligingen zijn ingesteld zoals bijvoorbeeld een wachtwoord. Als je de tekst kunt selecteren uit het bestand en kunt kopieren naar een standaard textdocument dan zal Google geen probleem hebben met het indexeren.

Afbeeldingen en links

Mocht de tekst in afbeeldingen zijn geplaatst dan kan het zijn dat Google met OCR een poging doet de tekst eruit te filteren maar geen garanties hier. Afbeeldingen zelf worden momenteel nog niet ge´ndexeerd. Links in PDF bestanden worden na het indexeren van het bestand gewoon gevolgd en kunnen tevens PageRank doorgeven.

Versie

Als laatste kan het handig zijn om een PDF document voor een lagere versie van Acrobat Reader te exporteren. Niet iedereen heeft direct de nieuwste versie van het programma. Iedere lezer, plus de zoekmachines kunnen dan het bestand vrijwel zeker openen.