Hlavní navigace

Rozpoznávání spamu metodami nezávislými na obsahu textu

5. 11. 2007

Sdílet

Mnoho současných metod detekce spamu je založeno na metodách analýzy obsahu, jako jsou Bayesovy filtry, a na metodách analýzy klíčových slov. Tyto metody však bývají v praxi spammery obcházeny pomocí jednoduchých změn textu. Pokud chceme dosáhnout pokud možno co nejvyšší úspěšnosti v boji proti nevyžádané poště a zároveň snížit četnost chybného blokování e-mailů (tzv. "false positives"), je nepochybně užitečné využít více než dosud nejrozšířenější metody analýzy spamu založené na zkoumání obsahu e-mailu: metody pracující s klíčovými slovy (např. Bayesovy filtry) nebo heuristickou analýzu. V minulém čísle Security jsme si popsali jednu z dalších alternativ - analýzu struktury (syntaktickou analýzu HTML kódu). Demonstrovali jsme její úspěšnost i na konkrétních příkladech z praxe a definovali jsme typy spamu, pro které je tento způsob detekce zvláště určen. Podobně přistoupíme i k popisu druhé nadstandardní metody boje proti nevyžádané poště, tzv. analýzy toků.

Autor článku