21.03.2004

MATRIX FORUM

Spam-Killer gegen Spam-Kings

Der deutsche IT-Journalist Jo Bager hat zehn verschiedene Desktop-Spam-Blocker und E-Mail-Programme mit eingebautem Spamfilter genauer unter die Lupe genommen und sie auf Benutzerfreundlichkeit und Zuverlässigkeit getestet.

So fintenreich die Spammer versuchen mit ihren Nachrichten in den Posteingang vorzudringen, so vielseitig sind auch bereits die Methoden der Spam-Blocker. Als Testumfeld verwendete der Journalist seine seine eigene Mailbox, in der neben Pressemitteilungen und Leserbriefen wöchentlich auch Hunderte Massen- und Werbeaussendungen eintrudeln.

Am bekanntesten ist das Prinzip der so genannten Header-Filter. Sie suchen nach bestimmten Textmustern in den Von-, An-, Betreff und weiteren Zeilen der E-Mails Ausschau halten. Zur E-Mail Sortierung werden aber auch "schwarze Listen" herangezogen, die E-Mails von bestimmten Absendern blockieren.

Sie eignen sich aber bestenfalls dazu, die Kommunikation mit nervigen Zeitgenossen abzudrehen, so Jo Bager. Denn die Versender von unseriösen Inhalten verwenden immer wieder neue E-Mail-Adressen.

Weiße Listen und "Viakra"

Eine weitere Methode sind die sogenannten "weißen Listen", die nur die Post bekannter Absender durchlassen. Eine Lösung, die vielleicht für manchen Privatgebrauch von Vorteil ist, für den professionellen Einsatz aber nicht in Frage kommt.

Spam-Barrikaden für bestimmte Schlüsselwörter haben unterdessen den Nachteil, dass die Versender unbegrenzte Möglichkeiten zur Wort- und Textverunstaltung haben.

Spamfresser: Bayes-Filter

Der Vorteil der statistischen Wortfilter liegt darin, dass sie sich nicht an einzelnen Wörtern die Zähne ausbeißen, so Jo Bager.

Die selbstlernenden Programme verwenden die so genannte Bayes'sche Formel. Ein Algorithmus, der von dem Mathematiker und Pfarrer Thomas Bayes im 18. Jahrhundert entwickelt wurde. Mit dieser Formel lässt sich die Wahrscheinlichkeit berechnen, mit der eine konkrete Mail mit dem Wort "Viagra" Spam ist.

Bevor der Bayes-Filter Nachrichten sortiert, muss das Programm mit Mails vertraut gemacht werden, die der Anwender als Spam identifiziert hat. Das gleiche gilt für erwünschte E-Mails. Durch die Analyse der Worthäufigkeiten lernt das Programm, welche Wörter als Spam-Kriterien taugen und welche nicht.