|
|
Kundeninformation
Web Service
|
|
Suchmaschinen-Marketing mit
Googles
PageRank-Verfahren
Heute kennt sie jedes Kind: Die Suchmaschine Google. Die einfach gestaltete
Google-Seite lässt sich intuitiv bedienen und liefert nach Eingabe eines
oder mehrerer Suchbegriffe eine Liste aller gefundenen Internet-Seiten.
Je nach Begrifflichkeit kann diese Auflistung gefundener Seiten schon
mal in die Millionen gehen, bei sehr speziellen Kombinationen der Suchbegriffe
aber kann auch nichts als Ergebnis dastehen. Google hat sich mit der
Qualität, der Schnelligkeit und der Anzahl der indizierten Seiten mittlerweile
als Standard etabliert obwohl es am Markt noch genügend andere Konkurrenten
gäbe. Dieser Text soll deswegen einen Einblick darüber geben, was man
heute über die Arbeitsweise der Suchmaschine weiß.
Wie auch jede andere automatische Suchmaschine besteht sie aus mehreren
Servern, die mit ausgeklügeltem Programm das Surfverhalten des Menschen
nachahmt. Um Besuch von Google zu bekommen, kann man seine Internet-Adresse
Google mitteilen. Allerdings ist die Wahrscheinlichkeit größer, dass
Google selbst durch Links von anderen Seiten selbst regelmäßig nach
dem Rechten sieht. So grast Google Seite für Seite ab und wechset über
Links dann auf Seiten verlinkter Anbieter. Die gesammelten Informationen
werden dann ausgewertet und gespeichert. Wurde so zum Beispiel eine
Seite zum Thema "Sportverletzungen" indiziert, so wird diese nach eingehender
Prüfung dann auch in der Ergebnisliste erscheinen, wenn als Stichwort
"Sportverletzungen" in Google eingegeben wurde. Da sich zum Ärgernis
des Besuchers die Liste oftmals über duzende von Seiten erstreckt, stellt
sich die Frage wie man als Betreiber einer Internet-Seite sich möglichst
unter den ersten Einträgen, wenn nicht sogar ganz oben, platzieren kann.
Bei Google handelt es sich um mehrere Faktoren, nach dem die Priorität
der Seiten geordnet wird. Zum einen geht es um die klassischen Kriterien
wie die Anzahl der vorkommenen Suchbegriffe und deren Dichte auf der
Seite, die Aktualität, ob das Suchwort eventuell auch in den sogenannten
Meta-Tags im Quellcode der Seite vorkommt (Stichwörter "Keywords", "Description"
und Bezeichnung des Seite mit "Title"), ob das Suchwort in Überschriften
auftaucht, etc.
Zum anderen kommt der Gewichtung einer Seite bei Google aber viel stärker
die Bedeutung des sog. "PageRank" bei. Hierbei handelt es sich um ein
von Google erfundenes Wertesystem, das von eins bis zehn die Wichtigkeit
einer Seite beurteilt ohne dies in Zusammenhang mit dem Inhalt zu stellen.
Die Wertigkeit richtet sich danach, ob andere wichtige Seiten mit ihrem
PageRank per Link auf sie verweisen und wie viele dieser Seiten das
tun. So steigt der PageRank (= PR) einer Seite mit PR1 wenn z.B. mehrere
Seiten über PR 6 auf diese Seite verweisen.
Google ist also der Meinung, wenn gut bewertete Seiten auf andere Seiten
verweisen, müssen diese auch wichtige Informationen beherbergen. Tun
dies mehrere wichtige Seiten, verstärkt sich dieser Effekt und der PageRank
steigt. Nun ist eine einzelne Seite meist mit anderen Seiten der Domain
verlinkt, was im Page-Rank Verfahren durch das sog. "Random Surfer Modell"
etwas beschränkt wird. Hier kommt ein gewisser Dämpfungsfaktor ( = "Damping
Factor") zum Einsatz der das Verhalten eines Internetnutzers nachstellen
soll. Es wird davon ausgegangen, dass der virtuelle Surfer nach und
nach das Interesse an dem gleichen Inhalt oder der gleichen WebSite
verliert und sich andere Themen und Internet-Seiten sucht.
Deswegen schwächt der Effekt der PageRank-Vererbung von Seite zu Seite
ab. Der Grund liegt klar auf der Hand: Würden Links ständig gleichberechtigt
bewertet werden, so könnte ein Internet-Seitenbetreiber seine eigenen
Seiten schnell durch geschicktes WebDesign künstlich nach ganz oben
drücken. Durch den Dämpfungsfaktor tappt Google zwar trotzdem in diese
Falle und bewegt sich im Kreis, das erzielte Ergebnis wird aber bei
jedem neuen Link immer schwächer.
Im von den Google-Gründern veröffentlichtem Algorithmus zum Errechnen
des PageRanks findet sich auch schnell ein anderes, kluges Schutzwerkzeug.
So fließt der PageRank einer hochbewerteten Seite zwar immer auf die
verlinkte Seite ein, wird aber immer durch die Anzahl aller vorhandenen
Links geteilt. So hätte eine Seite mit PR10 und 100 Links eine errechnete
Wirkung von 10 / 100, also nur 0,1 während eine Seite mit PR5 mit 20
Links auf 5 / 20 gleich 0,25 kommt. Dieses Beispielt zeigt, das nicht
nur ein hoher PageRank etwas nutzt sondern immer in Relation zu den
vorhandenen Links zu sehen ist und der Linktausch mit einer hochbewerteten,
aber mit vielen externen Links bestückten "Partnerseiten" wenig bringen
wird.
Beispiel-Berechnungen mit dem Google-Algorithmus zeigen auch, was passiert
wenn zwei Seitenbetreiber mit gleicher Struktur auf der Startseite einen
Linktausch vornehmen. So steigert sich der PageRank der Startseiten
zwar aber zum Nachsehen aller internen Unterseiten. Dies ist ein Effekt,
der den gesamten PageRank nur etwas zu Gunsten der Startseite ändert,
der gesamte PageRank einer Domain bleibt dadurch gleich! Vielen Anbietern
ist es aber nur wichtig, eine starke Startseite zu haben so dass sie
den Verlust von PageRank auf den Unterseiten wissend hinnehmen.
Google nimmt es dem Internet-Seiten-Betreiber auch krumm wenn dieser
zu viele "Dangling Links" auf seiner Seite hat. Mit diesem Ausdruck
bezeichnet man Seiten auf die per Link verwiesen wurde, die selbst dann
auch vom PageRank profitieren aber selbst sonst nirgendwo hin verlinken.
Dieses Verhalten ist im Sinne der Hypertext-Technik auch verständlich,
da man eben alles miteinander verbinden kann und dies ja gerade den
Reiz des Internets ausmacht. Dangling Links sollten also weitestgehend
vermieden werden.
Den PageRank einer Seite kann der Internet-Nutzer stets durch das von
Google zur Verfügung gestellte Programm, die "Google Toolbar" ermitteln
lassen. Dieses Programm ist ein PlugIn für den Microsoft Internet Explorer
und dient in seiner Hauptfunktion eigentlich dazu, stets Suchanfragen
an Google zu richten, deren Ergebnisse dann zu erhalten ohne auf die
Seite von Google wechseln zu müssen. Angezeigt wird der PageRank-Wert
dann durch einen grünen Balken. Dieses Tool sammelt so auch Daten zum
Nutzungsverhalten eines jeden Internet-Benutzers, der es installiert
hat. Es gibt Spekulationen, ob diese Suchdaten auch für die Vergabe
des PageRanks genutzt wird, allerdings wurde darüber noch nichts offizielles
bekannt.
Da das PageRank-Verfahren in Amerika patentiert wurde, erhält man durch
die Patentschrift noch weitere Einblicke in die Steuerung des PageRank-Verfahrens,
die nicht weniger wichtig sind. So wird ein Link stärker bewertet, wenn
er im Text kenntlich gemacht wird, so zum Beispiel wenn er größer, fett
oder kursiv angezeigt wird. Auch kann ein räumlicher Abstand zum restlichen
Text etwas bewirken.
Außerdem ist interessant, das wohl auch die Position auf einer Seite
die Wirkung des Links beeinflussen kann. So wird ein Link als wichtiger
erachtet, der in der ersten Hälfte des Textes als am Ende steht. Ein
anderes Kriterium in der PageRank-Patentschrift ist die Distanz der
beiden Seiten, die mit einem Link verbunden werden. So werden wohl Seiten,
deren Domain gleich ist logischerweise als sehr nahe zueinander bewertet,
was den PageRank nicht so stark beeinflussen könnte wie ein Link von
einer anderen Domain am besten noch mit anderer Länderkennung. Dies
ist zusätzlich zur oben beschriebenen Dämpfung eine weitere Maßnahme
gegen das untereinander Verlinken der gleichen Domain.
All diese Feinheiten sind Punkte, die Google bei der Vergabe des PageRanks
in Betracht zieht. Leider sind es bei weitem nicht alle. Dies rührt
daher, dass Google selbst ständig Neuerungen und Verbesserungen einführt,
die ohne Kenntnis der Welt zum Einsatz kommen. Verständlich soweit,
da sonst Seitenbetreiber weltweit nach Mitteln suchen würden um ihre
Seiten sofort den neuen Suchkriterien anzupassen.
Zurück zur neoNetcom-Startseite
|