Vernetzte Daten im Mitmach-Web

Semantic Web
05.12.2006

Das Semantically Interlinked Online Communities Project [SIOC] vernetzt Daten aus verschiedenen Online-Communities. Dadurch sollen verteilte Informationen leichter zugänglich werden.

Ob über Instant-Messaging-Dienste, E-Mails, Weblogs, Foren, Wikis oder Social-Networking-Sites wie MySpace, im Zeitalter des Mitmach-Webs tauschen sich Internet-Nutzer über zahlreiche Anwendungen untereinander aus.

Die dabei entstehenden Daten bleiben jedoch in der Regel isoliert.

Gezielte Suche

Das vom Digital Enterprise Research Institute an der National University of Ireland in Galway betriebene SIOC-Project sucht seit mittlerweile zwei Jahren nach Möglichkeiten, Daten aus verschiedenen Online-Communities miteinander zu vernetzen.

"SIOC soll es möglich machen, dass beispielsweise auf verschiedene Blogs, Foren und Mailing-Listen verteilte Informationen gezielt abgefragt werden können", erläutert Stefan Decker, der Leiter des Digital Enterprise Research Institute, der das SIOC-Projekt vergangene Woche auf der Konferenz Semantics 2006 im Wiener Tech Gate vorstellte.

SIOC-Ontologie

Der Kern des SIOC-Projektes besteht aus der SIOC-Ontologie, einem Vokabular, das die in den unterschiedlichen Diensten und Plattformen des Mitmach-Webs bereits vorhandenen und strukturierten Daten so aufbereitet, dass sie miteinander in Beziehung gesetzt werden können.

"Mit dem SIOC-Vokabular nutzen wir gemeinsame Strukturen aus, zum Beispiel das alle Dienste über Benutzer reden, über Informationen, die diese Benutzer bereitstellen, über Postings und Funktionen, die diese Postings haben. Das sind alles Gemeinsamkeiten, die dazu genutzt werden können, um eine verteilte Kommunikation im Internet zu ermöglichen und die Informationen zusammenzubringen", erklärt Decker.

E-Mail-Bewertung und Spam-Filter

Die Verfügbarkeit der vernetzten Daten kann auch zur Bewertung von E-Mails und zum Filtern von Spam genutzt werden.

"Meine Social-Networking-Informationen können mir dabei helfen zu entscheiden, welche Mails wichtig sind und schnell beantwortet werden müssen. Wenn ein Absender nicht in meinen sozialen Verbindungen aufscheint, könnte das Mail auch Spam sein", erklärt Decker.

Die so gewonnenen Daten können auch als Grundlage für Marktforschungs- und Trendanalysen dienen, skizziert Decker weitere SIOC-Anwendungsszenarien.

Export-Mechanismus

Zur Verbreitung von SIOC wurde ein Exporter für zahlreiche soziale Softwareanwendungen geschrieben. So sind unter anderem Plug-ins für die Weblog-Software Wordpress und b2evolution, für die Forensoftware phpBB und für das Content-Management-System Drupal verfügbar.

Auch ein Add-on für den Browser Firefox, mit dem die SIOC-Daten erkannt werden können, ist bereits erhältlich.

Netzwerkeffekte

"Wir müssen Anreize bieten, damit das Format auch benutzt wird", sagt Decker: "Im Grunde genommen geht es um die Frage, wie wird ein Standard viral". Decker hofft dabei auf Netzwerkeffekte.

Die Phase in der das Format "noch getötet" werden kann, sieht er als überwunden. Bis SIOC eine größere Verbreitung erfährt, könnte es laut Decker jedoch noch ein bis zwei Jahre dauern.

Auf der Konferenz Semantics 2006 wurde auch die Vision einer neuen Wikipedia vorgestellt, die Inhalte nicht nur präsentieren, sondern auch "verstehen" kann.