Immer noch wächst der E-Mail-Verkehr jährlich um 100 Prozent. In Unternehmen haben sich dadurch anfangs der Aufwand und die Kosten für Büromaterial und Porto erheblich verringert. Zunehmend erhalten die Unternehmen auf elektronischem Wege aber immer mehr unerbetene Nachrichten aller Art, die die Speicherbelastungen ebenso steigern wie die Personalbindung. Bestand 2002 rund ein Viertel der elektronischen Post aus Spam-Nachrichten, so wird sich dieser Anteil nächstes Jahr auf bis zu 40 Prozent fast verdoppeln.
Neben der teuren Bindung von Speicher- und Personalkapazitäten können schlimmstenfalls wichtige Nachrichten in der Spam-Flut untergehen, sei es durch das Verschieben in die falschen Ordner, in denen sie niemals bearbeitet werden, oder durch die Annahmeverweigerung überlasteter Server. Die auf diese Weise entstehenden Kosten wurden für 2002 von der EU-Kommission auf 2,5 Milliarden Euro geschätzt. Für 2003 hat sich dieser Wert ungefähr vervierfacht. Um der Problematik Herr zu werden, muss der Speicheraufwand verringert und gleichzeitig eine bessere Kategorisierung der elektronischen Post erreicht werden.
Herkömmliche E-Mail-Verwaltungsprogramme sind dazu meist nicht in der Lage. Sie orientieren sich statisch an aufwändig eingegebenen Vordefinitionen wie Namen, Absender, Eingangsdatum oder Schlüsselbegriffen. Gesucht sind Lösungen, die größtenteils autonom in den eingehenden Datenbeständen suchen, die Mails besser kategorisieren und im Endeffekt den Speicheraufwand reduzieren.
Die Support Vector Machine