© Bild: Modul University, Der Wissensplanet bei

Informationslandschaften zum Klimawandel

FORSCHUNG
05.06.2009

Mit "Media Watch on Climate Change" ist seit Freitag ein Umweltnetzwerk im Internet verfügbar, das Umweltthemen wie den Klimawandel und seine Folgen mit semantischen und geografischen Technologien analysiert und beobachtet. Informationslandschaften visualisieren anschließend die Suchergebnisse.

Seit 1972 gibt es den von den Vereinten Nationen ausgerufenen Weltumwelttag am 5. Juni. Für den Projektleiter des Umweltnetzwerks "Media Watch on Climate Change" ein guter Anlass, mit seinem Internet-Portal für den Klimawandel an die Öffentlichkeit zu gehen. Der Prototyp ist zwar bereits seit knapp zwei Jahren online, jetzt wurde die interaktive Aufbereitung allerdings komplett erneuert und ergänzt.

Das Projekt basiert auf einer Technologie, die im Rahmen von IDIOM (Information Diffiusion across Interactive Online Media) entwickelt wurde. IDIOM wurde im Rahmen der Programmlinie FIT-IT Semantic Systems vom Bundesministerium für Verkehr, Innovation und Technologie und dem FFG gefördert. Es soll als Vorzeigeprojekt für weitere Forschung in diesem Bereich dienen.

Analyse von Online-Dokumenten

Das Portal soll der Förderung von Umweltbewusstsein dienen und umweltrelevante Informationen interaktiv aufbereiten. Dazu werden wöchentlich zwischen 300.000 und 800.000 Online-Dokumente analysiert, die automatisch klassifiziert und beschlagwortet werden. Bei den analysierten Dokumenten handelt es sich derzeit um die Inhalte von Medienwebsites aus dem angloamerikanischen Raum, Umwelt-NGOs und Blogs.

"Unser Nachrichtensample besteht derzeit aus zirka 160 Medien aus den USA, Kanada, United Kingdom, Australien und Neuseeland", erläutert der Projektleiter Arno Scharl vom Institut für Neue Medientechnologie der Modul-Universität in Wien ORF.at.

Datenbank mit visueller Schnittstelle

"Das System kann außerdem die geografischen Koordinaten erkennen und feststellen, ob es sich um einen positiven oder negativen Bericht handelt", so Scharl. Die Dokumente, die Umweltschutzthemen zugeordnet werden können, kommen anschließend in eine gemeinsame Datenbank, die mit einer visuellen Schnittstelle verbunden ist. Über diese Schnittstelle lassen sich beispielsweise die Thementrends in "Informationslandschaften" ablesen.

Informationslandschaften mit Gebirgszügen

Diese visualisierten Informationslandschaften werden als Gebirge und Täler dargestellt. Vieldiskutierte Themen sehen wie Gebirgsmassive aus, weniger diskutierte Inhalte befinden sich im Tal. Je näher einander die Gebirge sind, desto inhaltlich näher sind sie einander. Räumliche Entfernung ist ein Maß der Unähnlichkeit. Die Landschaften lassen sich in der Folge auf Geobrowser wie NASA World Wind, Google Earth und Microsoft Virtual Earth projizieren.

"Derzeit arbeiten wir daran, das Ganze dynamisch zu machen. Wir wollen erreichen, dass man die Medienlandschaft beobachtet und plötzlich ein Vulkan aus dem Meeresboden kommt, das ist das nächste heiße Thema", so Scharl.

Wie werden Themen wahrgenommen?

Doch mit "Media Watch on Climate Change" lassen sich nicht nur die Trends erforschen, sondern auch feststellen, ob die Medienwahrnehmung eines Unternehmens der Eigenwahrnehmung beim Umweltschutz entspricht. "Wir wissen alle, dass es in den Medien oder auf Websites in der Eigen- und in der Fremdberichterstattung Unterschiede gibt, weil jeder dem ganzen einen Spin in seine Richtung geben will, um sein Ziel zu nutzen. Wir können uns mit dem Portal ansehen, wie oft über Themen berichtet wird, positiv oder negativ, und was damit assoziiert wird", so Scharl.

Das Portal wird derzeit zu diesem Zweck von der National Oceanic & Atmospheric Administration (NOAA) eingesetzt und getestet. Die Organisation will als nächsten Schritt einen Berater einsetzen, der die Kommunikation des Unternehmens mit den Medien auf der Basis der Ergebnisse verbessern soll.

Referenzprojekt für Österreich gesucht

Ähnliches wünscht sich der Projektleiter auch für Österreich: "Unser Ziel ist es, in Österreich ein ähnliches Referenzprojekt ins Leben zu rufen. Es gibt auch schon erste Vorgespräche." Außerdem geplant sei eine komplette deutschsprachige Variante des Projekts mit Analysemöglichkeiten von deutschsprachigen Medien, so Scharl.

Die Stimmungsanalyse, also die automatisierte Unterscheidung, ob es sich um positive oder negative Berichte handelt, gibt es für den deutschsprachigen Raum erst seit zwei Monaten. Diese ist laut Scharl die einzige sprachabhängige Technologie, die zum Einsatz kommt, und mitunter der Grund, warum das Projekt bisher nur für den englischsprachigen Raum optimiert ist.

Stimmungsanalyse oft schwierig

Die Stimmungsanalyse basiert auf einer Art Wörterbuch, das etwa 8.000 bis 9.000 Wörter als positiv und negativ klassifiziert. Dass das nicht immer ganz reibungslos abläuft, liegt auf der Hand: "Wir haben im letzten Jahr Leute über eine Facebook-Anwendung gebeten, Sätze zu bewerten, und da waren sich nicht einmal die Menschen einig, ob das jetzt als positiv oder neutral zu bewerten ist", erzählt Scharl. "Da kann man von keinem Algorithmus erwarten, dass er das zu 100 Prozent schafft." Laut Scharl sind die automatisierten Ergebnisse mit einer Erkennungsrate von über 80 Prozent dennoch "überraschend gut".

Bis auf den Einsatz von Yahoo- und Google-APIs, um die Inhalte von Blogs zu durchsuchen und zu spiegeln, basiert das Projekt "Media Watch on Climate Change" ausschließlich auf selbstständig entwickelten Technologien. Die Grundlage dafür bildet die semantische Webanalyse, mit der sich Scharl bereits seit 2002 beschäftigt und die sich derzeit im Aufwind befindet.

"Klassische Suche geht zu Ende"

Scharl ist überzeugt, dass diese die herkömmliche Websuche ablösen wird. "Die klassische Suche, wie sie von Google großgemacht wurde, wird irgendwann einmal zu Ende sein. Ich glaube nicht, dass wir in zehn Jahren einfach nur zehn Dokumente bekommen werden, ohne semantische Visualisierungen."

Mehr zum Thema:

(futurezone/Barbara Wimmer)