11.04.2003

STUFFED

Bildquelle: fuZo

Winzip entlarvt Mozarts "Ghostwriter"

Um Daten Platz sparend zu speichern und schneller zu versenden, verwenden Computernutzer Kompressionsprogramme, mit denen die Files bis auf ein Fünftel ihrer ursprünglichen Größe geschrumpft werden können.

Doch jedes herkömmliche Datenkompressionsprogramm wie Winzip, Stuffit und Gzip kann richtig eingesetzt auch zwischen klassischer Musik, Jazz und Rock unterscheiden, ohne dabei nur einen einzigen Ton hören zu müssen.

Diese neu entdeckte Fähigkeit könnte Wissenschaftlern sogar dabei helfen, bisher anonymen Musikstücken einen Verfasser zuzuordnen.

Datenkompression zur Sprachfindung

Schon Ende 2001 haben italienische Forscher eine ungewöhnliche Anwendung für Pack-Programme gefunden. Sie schafften es per Zip-Software, die Sprache eines Textes und mit hoher Wahrscheinlichkeit auch den betreffenden Autor zu identifizieren.

Dazu mussten zuerst einige lange Textfiles, jedes in einer bekannten Sprache, komprimiert werden. Die jeweilige Größe wurde dabei vermerkt.

Anschließend wurden die ursprünglichen Files erneut komprimiert, diesmal jedoch zusammen mit einem vorher beigefügten Textfile in bisher unbekannter Sprache.

Nun verglich man den Unterschied zwischen der gepackten Größe der alleinigen Files und dem Doppelpack-Ergebnis. Je kleiner der Unterschied, desto wahrscheinlicher ist es, dass beide Texte in der gleichen Sprache verfasst sind.

Differenzierung von Musikgenres

Rudi Cilibrasi, Paul Vit¿nyi und Ronald de Wolf vom "Dutch National Research Institute" in Amsterdam wollten nun versuchen, ob sich diese Technik auch zur Differenzierung von Musikrichtungen einsetzen lässt.

Sie starteten Tests mit verschiedensten Stücken, darunter welche von Beethoven, Miles Davis und Jimi Hendrix.

Zuerst wurden alle Daten, die nicht zum Rhythmus und der Melodie der eigentlichen Musik gehörten, wie etwa digitale ID-Tags, entfernt. Mit dem Linux-Packtool Bzip2 unterzogen sie die Dateien einer ähnlichen Prozedur wie die Textfiles, um zu sehen, wie ähnlich ein Stück dem anderen ist.

Erste Ergebnisse

In einem Test mit jeweils zwölf Titeln aus den Bereichen Klassik, Jazz und Rock landeten immerhin zehn Jazz-Titel, neun Rocksongs und die meisten klassischen Stücke auf dem richtigen der drei Äste.

Nahm man 32 klassische Stücke unter die Lupe, ordnete die Software jeden Komponisten einem eigenen Zweig zu.

So könnten etwa bisher nicht zuordenbare Kompositionen ihrem Schöpfer zugeordnet werden, wenn man zum Vergleich bekannte Stücke der Person hätte.