Technika využívá data miningu a předpokládá, že e-mail je specifický pro každého člověka podobně jako rukopis. Z tohoto důvodu vědci slibují, že dokáží identifikovat např. autory spamu, phishingu nebo kybernetické šikany.
Jaké jsou principy této „grafologie z klávesnice"? Má jít celkem pochopitelně o analýzu používaného slovníku (konkrétní slovní zásoba, ale i její bohatství), gramatiky, pravopisu i dalších speciálních vlastností (oslovení, obvykle dělané chyby, zkratky, lenost psát velká písmena ve jménech a na začátku věty...). Kombinace těchto vlastností vytváří pak signaturu/otisk, která má být ideálně jedinečná a jednoznačná. Systém údajně dokáže odlišit „původní" e-mail od např. přeposílaných částí textu, které pak analýza nebere v úvahu.
Rozhodovací funkce (zvaná AuthorMiner) se má lišit od metod používaných dříve. Předpokládá se, že technika by měla být dostatečně přesná, aby dokázala identifikovat pachatele mezi více podezřelými (např. lidé sdílející stejný počítač); samotnou IP adresa jako důkaz soud mnohdy neuzná. Vědci tvrdí, že systém se prakticky nedopouští chybného určení, v případě, že mezi více lidmi existuje velká shoda, připustí nejistotu. Přesnost metody samozřejmě závisí na tom, kolik e-mailů jednotlivých podezřelých je k dispozici.
K testu metody bylo použito asi 200 000 e-mailů, které napsalo 158 zaměstnanců společnosti Enron před jejím krachem. Systém dokázal správně určit autorství 80 % e-mailů, ve zbytku případů si nebyl jistý.
Zdroj: The Register