Schattenseite der elektronischen Kommunikation

Spam Die Spitze des Eisbergs

10.11.2006 | Redakteur: Andreas Bergler

Steffen EbertGeschäftsführer der Ebertlang Distribution GmbH

Trotz vieler rechtlicher Bemühungen gegen Spammer nimmt die Flut unerwünschter Werbe-Mails weiter zu und die Schäden für Unternehmen sowie für einzelne Verbraucher steigen. Internetnutzer sind immer noch auf sich selbst gestellt – nicht zuletzt deswegen werden effektive Anti-Spam-Systeme auch in nächster Zeit sehr gefragt sein.

Die Menge an Spam-Mails, die täglich die virtuellen Postfächer von Internet-Nutzern weltweit überflutet, hat enorme Größenordnungen angenommen. Jeder, der privat oder auch beruflich die bequeme und schnelle Kommunikation über das digitale Netz nutzt, kennt das Spam-Problem. Zuhauf stapeln sich in vielen eMail-Posteingängen die Nachrichten mit den schlüpfrigen Angeboten und der Werbung für potenzsteigernde Mittel. Der „4. Deutsche Anti-Spam-Kongress“, der vom Eco-Verband, dem Verband der deutschen Internetwirtschaft, im September 2006 veranstaltet wurde, brachte die Spam-Problematik klar auf den Punkt: Die Hemmschwelle der Spam-Täter wird immer niedriger. Ein Grund für diese Behauptung fanden die Kongress-Referenten in den 153 Fällen, die allein in Berlin im ersten Halbjahr dieses Jahres registriert wurden. Der Gesamtschaden betrug rund 730 000 Euro – dies entsprach einem Anstieg um rund 50 Prozent im Vergleich zum Vorjahr. Da es keine bundeseinheitliche Erfassung gibt, stellten die Experten des Kongresses fest, dass die Dunkelziffer der nicht gemeldeten und erfassten Fälle natürlich noch weit höher ist.

Aufgrund der Tatsache, dass in Deutschland kein Anti-Spam-Gesetz existiert, ist die Verfolgung und rechtliche Belangung von Spammern besonders schwierig. Am 17. Februar 2005 wurde im Deutschen Bundestag über den Entwurf eines zweiten Gesetzes zur Änderung des Teledienstgesetzes beraten. Hierbei ging es auch um die Aufnahme eines Anti-Spam-Gesetzes. Allerdings wurde das Vorhaben von der neuen Bundesregierung, die seit September 2005 im Amt ist, nicht mehr forciert.

Schwerer Anfang: Blacklists

Immer mehr eMail-Server und -Clients arbeiten mit integrierbaren Technologien, die vor Spam-Mails schützen, allerdings wird in den meisten Fällen nur ein begrenzter Schutz gewährleistet. Es gibt derzeit keine Lösung, die umfassende Sicherheit bietet, denn die Voraussetzungen, die eine umfangreiche Anti-Spam-Lösung erfüllen muss, sind sehr hoch. Der Knackpunkt liegt bei der korrekten Identifizierung einer Spam-Mail, denn das Erscheinungsbild ist meist trügerisch. Spam-Mails lassen sich oft erst auf den zweiten Blick von seriösen eMails unterscheiden. Somit ist das Risiko groß, dass erwünschte Nachrichten, die nicht in die Spam-Mail-Kategorie gehören, von Anti-Spam-Filtern ebenfalls automatisch entfernt werden.

Eines der ersten Anti-Spam-Verfahren war das sogenannte Blacklisting, das zu den Anfangszeiten des Internets zwischen 1990 und 1997 entwickelt wurde. Zu dieser Zeit waren Absenderverschleierungen der Spammer noch nicht üblich. Dementsprechend konnten Empfänger von unerwünschten Werbemails einfach die eMail-Adresse des Absenders, den IP-Adressbereich von Spammern oder auch die gesamte Domain mithilfe der Blacklists blocken. Ab 1997 begann der Internetboom und damit bildeten sich auch die vielseitigen Kommunikationswege aus, die von immer mehr Anwendern genutzt wurden. Eine Methodenvielfalt zur Spam-Bekämpfung gab es aber noch nicht. Die nach wie vor einzige Lösung, die den Verbraucher vor unerwünschten Spam-Mails schützte, waren immer noch die Blacklists. Allerdings stieß diese Methode an ihre Grenzen. Die Blacklists blockten nur eMails von Absendern, die im Adressverzeichnis der schwarzen Listen eingetragen waren. Ein recht einfaches Verfahren – deshalb war es nur eine Frage der Zeit, bis Spammer eine Methode entwickelten, um diese Technologie zu umgehen. Ihre Methode bestand in der Benutzung von temporären eMail-Adressen oder im Missbrauch von fremden eMail-Servern, die für den Versand von Spam-Mails zweckentfremdet wurden. Entwickler der Anti-Spam-Filter sahen sich durch die immer ausgefeilteren Verschleierungstaktiken der Spammer vor neue Herausforderungen gestellt.

Regelbasierter Schutz

Die schwarzen Listen hatten noch nicht ausgedient – aber es musste eine Anti-Spam-Lösung gefunden werden, die eMails differenzierter untersuchte. Mit der Überlegung, die Inhalte der eMails auf Begriffe hin zu analysieren und dementsprechend zu filtern, wurde der regelbasierte Schutz entwickelt. Die vom Benutzer definierten Regeln durchleuchten eMails auf ihre Begriffe und ordnen diese bestimmten Kategorien zu. Der Nachteil dieser Analyse liegt auf der Hand: Knackt der Spammer das System und lernt die Regeln des Systems kennen, kann er auch diese Schutzfunktion umgehen. Dies veranlasste Software-Entwickler, einen Schritt weiter zu gehen. Sie erkannten, dass der Mensch selbst es ist, der mit seinem ausgeprägten Sinn für Analytik die besten Voraussetzungen für die schnelle Erkennung von Spam-Mails bietet. Ungeachtet der intensiven Forschung auf dem Bereich der Interpretation von Text und Sprache, neuralen Netzen oder allgemeiner Statistik sind die Ergebnisse der besten Softwareprogramme auch heute noch nicht mit dem Urteilsvermögen eines Menschen vergleichbar.

Folglich musste ein System entwickelt werden, dass eMails nach einem ähnlichen Muster untersucht, wie es der menschliche Verstand anwenden würde. Den Grundstein hierfür bildete die statistische hypothetische Analyse in Form des „Bayesian Filter“. Diese Technologie untersucht und selektiert Nachrichten anhand von statistischen Gesichtspunkten. Ein wichtiger Aspekt der statistischen Methode ist die Möglichkeit, das System zu trainieren. Der Benutzer kategorisiert seine eMails entsprechend in erwünschte (Ham) und unerwünschte Nachrichten (Spam). Aufgrund dieser Kennzeichnung erstellt der Bayesian Filter eine Liste mit Wörtern, die in diesen unerwünschten eMails oft vorkommen. Wenn der Benutzer beispielsweise eMails, die für Viagra werben, als Spam kennzeichnet, haben alle Nachrichten mit dem Wort „Potenz“ eine hohe Spam-Wahrscheinlichkeit. Einzelne Schlüsselwörter sind allerdings für eine eindeutige Filterung nicht ausreichend, ausschlaggebend ist die Gesamtsumme der Bewertungen der einzelnen Wörter, die der Bayesian Filter vornimmt.

Damit erwünschte Nachrichten wie beispielsweise Lieferanten-Newsletter oder -Werbung von den Spam-Filtern nicht als vermeintliche Spam-Mails klassifiziert werden, haben Programmierer so genannte Whitelists entwickelt. Während die schwarzen Listen, der regelbasierte Schutz und die hypothetische Analyse im Verbundsystem immer bessere Ergebnisse erzielten, stieg der Bedarf an weißen Listen. Auf den Whitelists werden Absender eingetragen, deren eMail-Formate und -Inhalte Spams zwar gleichen, deren Nachrichten für den Empfänger aber keine Spams sind. Dadurch können die Nachrichten des auf der Liste geführten Absenders den Spam-Filter ungehindert passieren.

Hyperlinks in eMails

SURBL (Spam URI Realtime Blocklists) ist ein effektives Anti-Spam-System, das neben der Absenderüberprüfung auch Inhalte der eMails auf eingetragene Hyperlinks inspiziert. Absender von Spam-Mails verschleiern sehr oft ihre Herkunft – die Link-Adresse zur eigenen Website, die innerhalb der Nachricht beworben wird, wird jedoch nur äußerst selten geändert, da dies meist mit Kosten verbunden ist. Das Anti-Spam-Modul SURBL arbeitet bei der Erkennung solcher Hyperlinks äußerst zuverlässig: 40 bis 60 Prozent aller Spam-eMails werden bei einer Fehlerquote von praktisch null Prozent automatisch identifiziert. Der SURBL-Filter wird dabei automatisch von entsprechenden Datenbanken, die permanent von Nutzern aus aller Welt mit neuesten Informationen gefüttert werden, mit Updates versorgt. So ist gewährleistet, dass das System auf dem neusten Stand bleibt.

SPF, Sender ID und DKIM

Mit gefälschten Absenderadressen versenden Spammer Tausende eMails am Tag an abermals so viele Nutzer. Diese Taktik macht es zum einen schwer, schwarze Listen zu führen, zum anderen führt es immer wieder dazu, dass Domains unschuldigerweise auf solchen schwarzen Listen landen, weil sie durch Spammer missbraucht wurden. Um das Fälschen von Absenderadressen zu erschweren, wurden mehrere Technologien entwickelt, wobei die wichtigsten DKIM (Domain Keys Identified Mail), Microsofts Sender ID und SPF (Sender Policy Framework) von Pobox.com-Gründer Meng Wong sind. Ein wichtiges Prinzip, das Sender ID und SPF verfolgen, ist die Offenlegung der Identität. Der Absender einer eMail muss demnach die IP-Adresse des eigenen Mailservers bekannt geben. Dies ermöglicht es einem eMail-Server, der eine Nachricht von einem anderen eMail-Server erhält, die IP-Adresse des Absenders mit der veröffentlichten IP-Adresse zu vergleichen. DKIM hingegen fügt der eMail eine digitale Signatur hinzu: Zum einen lässt sich so der Ursprung der Nachricht nachweisen, und zum anderen kann man überprüfen, ob der Inhalt der eMail verändert wurde.

Die ideale Lösung

Betrachtet man beispielsweise die bekannten eMail-Provider Yahoo.com und Hotmail.com, deren Domains für viele weitverbreitete Spam-Mails missbraucht wurden, wird die Tragweite des Spam-Übels deutlich. Eine konsequente Anwendung von Sender ID oder SPF würde einen deutlichen Rückgang der Spam-Mails zur Folge haben. Voraussetzung ist allerdings eine konsequente Umsetzung dieser Verfahren: Mit der Benutzung dieser Lösung müssten sich die Anwender bereit erklären, die IP-Adresse ihres eigenen eMail-Servers mit zu versenden und eingehende Nachrichten ohne diese Informationen konsequent zu löschen – eine Methode, die einer sehr breiten Akzeptanz unter den eMail-Nutzern bedarf.

Auch wenn doch ein Anti-Spam-Gesetz in naher Zukunft vom Deutschen Bundestag erlassen werden sollte, werden Spammer ihre Angriffe allenfalls reduzieren, aber wohl kaum von Spam-Attacken Abstand nehmen. Zudem wird die Einigung auf einen einheitlichen Standard des Identifikationsverfahrens per IP-Adresse auf sich warten lassen, und der Verbraucher ist nach wie vor von seinen Anti-Spam-Programmen oder dem Anti-Spam-Angebot seines eMail-Providers abhängig. Die optimale Lösung für eine nahezu ungestörte Kommunikation im Netz vereint deshalb sowohl schwarze als auch weiße Listen, den regelbasierten Schutz, die statistische hypothetische Analyse und im besten Fall auch das SPF-Verfahren.

Kommentare werden geladen....

Sie wollen diesen Beitrag kommentieren? Schreiben Sie uns hier

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 2000805 / Technologien & Lösungen)