Kaspersky Lab si nechal patentovat novou metodu na rozpoznávání spamu

Jedna z nejpopulárnějších a nejefektivnějších metod boje proti nežádoucím e-mailům se zakládá na klasifikaci zpráv podle toho, zda obsahují klíčová slova a fráze, jež jsou pro nevyžádanou poštu typické.


Tento přístup lze využít k rychlé konfiguraci systému na blokování nových typů nevyžádané pošty. Zajišťuje také vysokou úspěšnost odhalování při minimálním počtu chybných vyhodnocení.

Nová technologie patentovaná Kaspersky Lab se vychází z výše uváděného systému, který využívá na zjišťování nevyžádané pošty klíčová slova a fráze. Tato nová technologie byla zaregistrována Úřadem Spojených států pro patenty a ochranné známky 16. listopadu 2010 pod číslem patentu 7 836 061.

Patentovaná metoda klasifikuje zprávy na základě hierarchického seznamu kategorií, který je označován jako heslář. Každá kategorie je definována množinou klíčových termínů a určitým počtem šablon. Příchozí zpráva je kategorizována pomocí výpočtu její relativity vůči všem kategoriím klíčových slov uvedených v dané zprávě a poté je porovnáván stupeň podobnosti s každou ze šablon. Pokud zpráva obsahuje určitý počet klíčových slov, nebo je dostatečně podobná některé ze šablon, je zařazena do jedné z kategorií, včetně nevyžádané pošty.

Kategorie zpráv lze vytvořit ručně pomocí klíčových termínů a šablon. Každou kategorii lze rozdělit na podkategorie, aby se docílilo přesnější klasifikace. Aby se dále zlepšilo a zjednodušilo zařazování do kategorií, zprávy lze předběžně zpracovat např. automatickým zjištěním jazyka, odebráním často používaných slov - např. členů a předložek - a odfiltrováním šumu.











Komentáře