neonetcom Webdesign

Kundeninformation
Web Service



Suchmaschinen-Marketing mit Googles
PageRank-Verfahren

Heute kennt sie jedes Kind: Die Suchmaschine Google. Die einfach gestaltete Google-Seite lässt sich intuitiv bedienen und liefert nach Eingabe eines oder mehrerer Suchbegriffe eine Liste aller gefundenen Internet-Seiten. Je nach Begrifflichkeit kann diese Auflistung gefundener Seiten schon mal in die Millionen gehen, bei sehr speziellen Kombinationen der Suchbegriffe aber kann auch nichts als Ergebnis dastehen. Google hat sich mit der Qualität, der Schnelligkeit und der Anzahl der indizierten Seiten mittlerweile als Standard etabliert obwohl es am Markt noch genügend andere Konkurrenten gäbe. Dieser Text soll deswegen einen Einblick darüber geben, was man heute über die Arbeitsweise der Suchmaschine weiß.

Wie auch jede andere automatische Suchmaschine besteht sie aus mehreren Servern, die mit ausgeklügeltem Programm das Surfverhalten des Menschen nachahmt. Um Besuch von Google zu bekommen, kann man seine Internet-Adresse Google mitteilen. Allerdings ist die Wahrscheinlichkeit größer, dass Google selbst durch Links von anderen Seiten selbst regelmäßig nach dem Rechten sieht. So grast Google Seite für Seite ab und wechset über Links dann auf Seiten verlinkter Anbieter. Die gesammelten Informationen werden dann ausgewertet und gespeichert. Wurde so zum Beispiel eine Seite zum Thema "Sportverletzungen" indiziert, so wird diese nach eingehender Prüfung dann auch in der Ergebnisliste erscheinen, wenn als Stichwort "Sportverletzungen" in Google eingegeben wurde. Da sich zum Ärgernis des Besuchers die Liste oftmals über duzende von Seiten erstreckt, stellt sich die Frage wie man als Betreiber einer Internet-Seite sich möglichst unter den ersten Einträgen, wenn nicht sogar ganz oben, platzieren kann.

Bei Google handelt es sich um mehrere Faktoren, nach dem die Priorität der Seiten geordnet wird. Zum einen geht es um die klassischen Kriterien wie die Anzahl der vorkommenen Suchbegriffe und deren Dichte auf der Seite, die Aktualität, ob das Suchwort eventuell auch in den sogenannten Meta-Tags im Quellcode der Seite vorkommt (Stichwörter "Keywords", "Description" und Bezeichnung des Seite mit "Title"), ob das Suchwort in Überschriften auftaucht, etc.
Zum anderen kommt der Gewichtung einer Seite bei Google aber viel stärker die Bedeutung des sog. "PageRank" bei. Hierbei handelt es sich um ein von Google erfundenes Wertesystem, das von eins bis zehn die Wichtigkeit einer Seite beurteilt ohne dies in Zusammenhang mit dem Inhalt zu stellen. Die Wertigkeit richtet sich danach, ob andere wichtige Seiten mit ihrem PageRank per Link auf sie verweisen und wie viele dieser Seiten das tun. So steigt der PageRank (= PR) einer Seite mit PR1 wenn z.B. mehrere Seiten über PR 6 auf diese Seite verweisen.

Google ist also der Meinung, wenn gut bewertete Seiten auf andere Seiten verweisen, müssen diese auch wichtige Informationen beherbergen. Tun dies mehrere wichtige Seiten, verstärkt sich dieser Effekt und der PageRank steigt. Nun ist eine einzelne Seite meist mit anderen Seiten der Domain verlinkt, was im Page-Rank Verfahren durch das sog. "Random Surfer Modell" etwas beschränkt wird. Hier kommt ein gewisser Dämpfungsfaktor ( = "Damping Factor") zum Einsatz der das Verhalten eines Internetnutzers nachstellen soll. Es wird davon ausgegangen, dass der virtuelle Surfer nach und nach das Interesse an dem gleichen Inhalt oder der gleichen WebSite verliert und sich andere Themen und Internet-Seiten sucht.

Deswegen schwächt der Effekt der PageRank-Vererbung von Seite zu Seite ab. Der Grund liegt klar auf der Hand: Würden Links ständig gleichberechtigt bewertet werden, so könnte ein Internet-Seitenbetreiber seine eigenen Seiten schnell durch geschicktes WebDesign künstlich nach ganz oben drücken. Durch den Dämpfungsfaktor tappt Google zwar trotzdem in diese Falle und bewegt sich im Kreis, das erzielte Ergebnis wird aber bei jedem neuen Link immer schwächer.

Im von den Google-Gründern veröffentlichtem Algorithmus zum Errechnen des PageRanks findet sich auch schnell ein anderes, kluges Schutzwerkzeug. So fließt der PageRank einer hochbewerteten Seite zwar immer auf die verlinkte Seite ein, wird aber immer durch die Anzahl aller vorhandenen Links geteilt. So hätte eine Seite mit PR10 und 100 Links eine errechnete Wirkung von 10 / 100, also nur 0,1 während eine Seite mit PR5 mit 20 Links auf 5 / 20 gleich 0,25 kommt. Dieses Beispielt zeigt, das nicht nur ein hoher PageRank etwas nutzt sondern immer in Relation zu den vorhandenen Links zu sehen ist und der Linktausch mit einer hochbewerteten, aber mit vielen externen Links bestückten "Partnerseiten" wenig bringen wird.
Beispiel-Berechnungen mit dem Google-Algorithmus zeigen auch, was passiert wenn zwei Seitenbetreiber mit gleicher Struktur auf der Startseite einen Linktausch vornehmen. So steigert sich der PageRank der Startseiten zwar aber zum Nachsehen aller internen Unterseiten. Dies ist ein Effekt, der den gesamten PageRank nur etwas zu Gunsten der Startseite ändert, der gesamte PageRank einer Domain bleibt dadurch gleich! Vielen Anbietern ist es aber nur wichtig, eine starke Startseite zu haben so dass sie den Verlust von PageRank auf den Unterseiten wissend hinnehmen.

Google nimmt es dem Internet-Seiten-Betreiber auch krumm wenn dieser zu viele "Dangling Links" auf seiner Seite hat. Mit diesem Ausdruck bezeichnet man Seiten auf die per Link verwiesen wurde, die selbst dann auch vom PageRank profitieren aber selbst sonst nirgendwo hin verlinken. Dieses Verhalten ist im Sinne der Hypertext-Technik auch verständlich, da man eben alles miteinander verbinden kann und dies ja gerade den Reiz des Internets ausmacht. Dangling Links sollten also weitestgehend vermieden werden.

Den PageRank einer Seite kann der Internet-Nutzer stets durch das von Google zur Verfügung gestellte Programm, die "Google Toolbar" ermitteln lassen. Dieses Programm ist ein PlugIn für den Microsoft Internet Explorer und dient in seiner Hauptfunktion eigentlich dazu, stets Suchanfragen an Google zu richten, deren Ergebnisse dann zu erhalten ohne auf die Seite von Google wechseln zu müssen. Angezeigt wird der PageRank-Wert dann durch einen grünen Balken. Dieses Tool sammelt so auch Daten zum Nutzungsverhalten eines jeden Internet-Benutzers, der es installiert hat. Es gibt Spekulationen, ob diese Suchdaten auch für die Vergabe des PageRanks genutzt wird, allerdings wurde darüber noch nichts offizielles bekannt.

Da das PageRank-Verfahren in Amerika patentiert wurde, erhält man durch die Patentschrift noch weitere Einblicke in die Steuerung des PageRank-Verfahrens, die nicht weniger wichtig sind. So wird ein Link stärker bewertet, wenn er im Text kenntlich gemacht wird, so zum Beispiel wenn er größer, fett oder kursiv angezeigt wird. Auch kann ein räumlicher Abstand zum restlichen Text etwas bewirken.
Außerdem ist interessant, das wohl auch die Position auf einer Seite die Wirkung des Links beeinflussen kann. So wird ein Link als wichtiger erachtet, der in der ersten Hälfte des Textes als am Ende steht. Ein anderes Kriterium in der PageRank-Patentschrift ist die Distanz der beiden Seiten, die mit einem Link verbunden werden. So werden wohl Seiten, deren Domain gleich ist logischerweise als sehr nahe zueinander bewertet, was den PageRank nicht so stark beeinflussen könnte wie ein Link von einer anderen Domain am besten noch mit anderer Länderkennung. Dies ist zusätzlich zur oben beschriebenen Dämpfung eine weitere Maßnahme gegen das untereinander Verlinken der gleichen Domain.

All diese Feinheiten sind Punkte, die Google bei der Vergabe des PageRanks in Betracht zieht. Leider sind es bei weitem nicht alle. Dies rührt daher, dass Google selbst ständig Neuerungen und Verbesserungen einführt, die ohne Kenntnis der Welt zum Einsatz kommen. Verständlich soweit, da sonst Seitenbetreiber weltweit nach Mitteln suchen würden um ihre Seiten sofort den neuen Suchkriterien anzupassen.


Zurück zur neoNetcom-Startseite