« Meet Wahrner, Sörensen, Herrn Lehmann und Prof. Wedemeier | Main | Bürokunst »

Dienstag, April 24, 2007

Wiedergelesen: Google-Jäger Ask Jeeves

Zuweilen lesen sich Geschichten Jahre später noch besser, weil man weiß, ob und was aus dem Anspruch oder Traum geworden ist: Hier hat ein Mathe-Prof seine Herangehensweise an das Problem der Informationsflut und -bewältigung beschrieben und es läßt die Zeit erahnen, als Google noch nicht Google war und seinen Gründer nur Studenten:

Apostolos Gerasoulis interessierte sich damals vor allem deshalb für Suchprogramme, weil sie mit linearen Algorithmen arbeiteten, sein Fachgebiet. Er leitete zu jener Zeit eine Arbeitsgruppe an der Universität von Rutgers. Den Studenten legte er zwei Aufsätze vor, die unter Experten heiß diskutiert wurden. Es ging um die Frage, mit welcher Ranking-Methode sich die Dokumente des Internet am besten ordnen ließen. Eine Arbeit kam aus Stanford und war geschrieben worden von zwei jungen Informatikern, Sergey Brin und Larry Page.

Deren Idee war, dass das Internet selbst eine Aussage darüber macht, wie wichtig ein Dokument ist, durch die Anzahl von Links, die darauf verweisen, deren Gewicht wiederum bestimmt wird von der Anzahl der Links, die auf sie deuten, und so weiter. Auf die Seite einer überregionalen Zeitung zeigen heute etwa 50000 Links, auf die private Homepage eines Bloggers verweisen vielleicht drei seiner Kumpels. Schreibt er aber besonders interessant über das Thema – wie der junge Iraker Salam Pax, der aus Bagdad über den Krieg berichtete und mit seinem Internet-Tagebuch berühmt wurde –, dann kann es sein, dass immer mehr und immer wichtigere Seiten auf ihn verweisen, sodass er zu einem bestimmten Stichwort weiter oben steht als die Profis. Nach diesem Prinzip sollte das Suchprogramm von Brin und Page funktionieren.

Apostolos Gerasoulis fand den Ansatz gut, aber nicht ganz so elegant wie die zweite Idee. Sie stammt von John Kleinberg, einem amerikanischen Mathematiker. Kleinberg ging noch einen Schritt weiter. Er schlug vor, dass nicht alle Links gezählt werden sollten, sondern nur die, die von Seiten kommen, die sich mit dem Thema der Suchanfrage beschäftigen.

Erstellt von tixus um 7:16 PM Kategorien:
Powered by
Thingamablog 1.1b6