Gen-Bot-Experiment in der Wikipedia

08.07.2008

US-Forscher haben in der englischsprachigen Wikipedia ein Experiment zur besseren Vernetzung des Wissens über Gene durchgeführt. Die ersten Ergebnisse ihres Versuchs haben sie jetzt publiziert.

In der neuesten Ausgabe des Fachjournals PLoS Biology hat eine Gruppe von Wissenschaftlern um Andrew I. Su vom Genomics Institute der Novartis Research Foundation in San Diego einen Artikel über eine besondere Art der Nutzung der Wikipedia als Wissensspeicher für die Genforschung publiziert.

Die Gruppe schrieb einen Bot, der automatisch Informationen zu Säugetiergenen aus der Fachdatenbank Entrez Gene holt, mit einem besonderen Layout versieht und als rudimentären Artikel ["Stub"] in der Wikipedia anlegt. Der Bot holt Kurzbeschreibung und ein Bild der Proteinstruktur aus der Fachdatenbank, außerdem fügt er eine Liste wissenschaftlicher Publikationen an, in denen das bestimmte Gen eine Rolle spielt. Dazu kopiert er Links zu anderen relevanten Datenbanken, in denen sich Informationen zu dem Gen finden lassen.

Da sich die vom Bot angelegten Artikel wie alle anderen Wikipedia-Artikel auch von jedem schnell und einfach edieren lassen, hoffen die Wissenschaftler, dass Fachkollegen und Forscher aus angrenzenden Gebieten die vorliegenden Daten ergänzen und verbessern. Den Bot setzten sie ein, weil sie davon ausgingen, dass das bloße Vorhandensein eines "Stubs" schon die Hemmschwelle zur Einbringung von Wissen senken würde.

PLoS Biology ist ein Open-Access-Journal. Der Zugang zu den dort veröffentlichten Artikeln ist frei.

Verstärkte Aktivität

Aus Sicht der Gruppe um Su hat sich das Experiment gelohnt. Bis Februar - sie schreiben in ihrem Artikel nicht, wann sie den Bot gestartet haben - hat ihre Software 7.500 neue standardisierte "Stubs" in der englischsprachigen Wikipedia angelegt und 650 bereits existierende Artikel zum Thema Genetik ergänzt.

In den 7.500 neuen Artikeln habe die editorische Aktivität der Wikipedia-Beiträger zwar nur ein Zehntel derjenigen in den "alten" Artikeln erreicht, aber insgesamt hätten sich nach Anlegung der neuen Artikel rund 50 Prozent der Beiträgeraktivitäten auf allen Artikeln, die mit Genen zu tun hatten, auf den vom Bot angelegten "Stubs" abgespielt.

Außerdem zeigten sich die Forscher mit der Sichtbarkeit der Gen-Seiten auf Google zufrieden. Bei einer Google-Suche nach den Gen-Symbolen tauchten 66 Prozent der spezifischen Wikipedia-Seiten auf der ersten Seite der Ergebnisse auf. Außerdem sei die Wikipedia aufgrund ihrer Struktur besonders gut dazu geeignet, Verbindungen zwischen den Gendaten sowie ihren verschiedenen Anwendungen aufzuzeigen.

Vermehrung des Wissens

Die Forscher hoffen, mit ihrer Aktivität eine Feedback-Schleife in Gang zu setzen, im Lauf derer die Informationen zu den Genen laufend verbessert und in immer mehr Wissenszusammenhänge integriert werden. Angst vor Vandalismus in der Wikipedia haben die Autoren der Studie nicht. Es habe sich erwiesen, dass die Wikipedia in Sachen Qualität auch mit Großprojekten wie der Encyclopedia Britannica mithalten könne, schreiben sie in einem Begleittext zu dem Artikel.

Die Gruppe denkt daran, das Experiment auch in Larry Sangers Wikipedia-Konkurrenzprojekt Citizendium zu starten. Dort können nur Autoren Artikel anlegen und verändern, die sich mit Klarnamen registriert haben. Zunächst habe man aber die Wikipedia bevorzugt, da diese eine kritische Masse an Autoren und ein gutes Google-Ranking geboten habe. Spezialisierte Gendatenbanken könne das Projekt nicht ersetzen.

Der Einsatz von Bots

Auf Nachfrage von ORF.at sagte Mathias Schindler von der deutschsprachigen Wikipedia, dass ein solcher Einsatz von Bots eigentlich nichts Neues sei. "Auf der deutschsprachigen Wikipedia sehen wir die Bots allerdings nicht so gerne", so Schindler, der als Gegenbeispiel zum Genprojekt einen Versuch anführt, in dessen Rahmen auf der englischsprachigen Wikipedia automatisiert Artikel zu US-Städten angelegt und mit Informationen aus einer Datenbank der US-Volkszählung befüllt worden waren. Die automatisch generierten und mit rudimentären Daten versehenen Artikel seien letztlich wenig interessant gewesen.

Die US-Genforscher haben ihren Bot auch unter der Apache-Lizenz 2.0 als Open-Source-Code in Java ins Repository von Google Code eingestellt. Der Einsatz von solchen Bots in der Wikipedia muss allerdings erst von den Administratoren genehmigt werden.