Der Google-Index

Welche Komponenten steuern die Google-Suche?

Hast Du dich schon einmal gefragt, wie es eigentlich dazu kommt, dass dir Google nach Eingabe eines Suchbegriffes innerhalb von wenigen Sekunden Seiten ausspuckt, die genau deine Suchwörter enthalten? Dass du binnen kürzerster Zeit relevante Informationen erhältst, verdankst du dem Google-Index.

Im Netz befinden sich derzeit geschätzt fast 50 Milliarden Webseiten, in der Theorie müsste Google also alle diese Seiten einzeln nach deinem Suchbegriff durchsuchen, damit du die passenden Ergebnisse bekommst. In der Praxis würde das natürlich viel zu viel Zeit in Anspruch nehmen. Suchmaschinen gehen also nicht live über alle Seiten des World Wide Web, sondern bedienen sich eines vorher angelegten Index.

Wie wird der Google-Index erstellt?

1. Die Webcrawler

Die Webcrwaler oder auch Searchbots sind Computerprogramme, die das Internet nach Webseiten durchforsten um diese analysieren zu können. Dazu laden sie eine beliebige Seite zunächst in einen Store herunter und filtern die vorhandenen Hyperlinks (also die Verlinkungen zu anderen Webseiten) heraus. Diese Liste wird dann an den „Scheduler“ (siehe 2.) weitergeleitet. Auf diese Weise werden auch URLs identifiziert, die nicht mehr gültig sind und daher nicht in den Index aufgenommen werden müssen.

Freshbots und Deepbots

Erscheint eine neue Seite im Netz, starten die Freshbots mit ihrer Arbeit und erfassen zunächst oberflächlich meist nur die wichtigsten Unter-Seiten der Website. Somit sind die Textbausteine recht schnell im Index gespeichert. Die Freshbots prüfen in den kommenden Tagen auch neuste Aktualisierungen der Seite, um möglichst immer die aktuelle Version im Index zu haben.

Deepbots gehen, wie der Name schon sagt, tiefer in die Materie der Seite hinein. Sie erfassen auch andere Dateitypen wie Bilder oder PDF-Dateien. Diese Inhalte brauchen etwas länger, bis sie ihren Weg in den Index finden (Tage bis Wochen).

2. Der Scheduler

Der Schedular ist eine Art Sammelstelle für Websiten-URLs, außerdem steuert er die Aussendung der Crawler zu diesen Adressen. Der Pool an URLs wächst stetig an, denn immer wieder finden Crawler auf den Seiten, die sie durchsuchen, Verlinkungen auf weitere Seiten. Auf diese Weise wird nahezu das gesamte World Wide Web unterwandert und die gefundenen Inhalte heruntergeladen.

3. Der Index

Die Dokumente, die die Crawler herunterladen werden in ihre Bestandteile aufgespalten (Bilder, Texte, Videos, etc.) und daraufhin analysiert, für welche Suchbegriffe und in welchem Umfang sie dafür relevant sind. Kriterien dafür können beispielsweise die Häufigkeit und die Stelle im Text sein (Überschrift oder Absatz). Aus all diesen Ergebnissen berechnen die Programme eine Relevanz für die jeweiligen Keywords. Diese entscheidet darüber, auf welcher Position eine Webseite erscheint, wenn der Suchbegriff in die Suchmaschine eingegeben wird: Der Google-Index.

Fazit:

Gibt ein User einen Suchbegriff in die Google-Suchleiste ein, wird nicht jedes Dokument auf jeder Webseite durchsucht, sondern lediglich der von Google erstellte Index. Das hat jedoch auch zur Folge, dass man kein 100% aktuelles Abbild des World Wide Web erhält, da die Crawler nicht jede Sekunde jede Website auf Änderungen hin untersuchen können. Google hat aber in den vergangenen Jahren stark daran gearbeitet und große Verbesserungen in Sachen Aktualität erzielt.

Ausblick: Der mobile first Index

Ein Großteil der Suchen wird heutzutage über das Smartphone getätigt. Damit sich Ladezeiten in Grenzen halten und Websiten korrekt angezeigt werden, müssen diese auch speziell für mobile Endgeräte optimiert werden.

Zwar findet bereits eine Abstufung solcher Seiten statt, die diese Optimierung nicht aufweisen, dennoch steht die Desktop-Version immer noch im Fokus der Beurteilung. Mit dem mobile first Index soll sich das ändern. Dann werden Webseiten, die fehlerhaft oder nicht für Smartphones optimiert sind auch in den Desktop-Suchen abgestraft. Wann genau der Index eingeführt wird, ist aber noch nicht bekannt.

Der Google-Index bestimmt, auf welcher Position deine Webseite erscheint. Je besser Du deine Seite in Bezug auf die für dich wichtigen Suchbegriffe hin optimierst, desto besser wird Google sie bewerten. Die Agentur brand-kommunikation steht dir hierbei gerne zur Seite. Nehmen Sie Kontakt zu uns auf.