Michael Brennan a Rachel Greenstadtová z Drexelovy University v Philadelphii nyní ale publikovali výsledky ukazující na to, že stylometrické techniky se dají poměrně snadno zmást. Lze vytvořit dopis, který bude pomocí analýzy přiřazen někomu jinému. Není k tomu potřeba být přitom literárním teoretikem, lingvistou ani softwarovým expertem.
Vědci požádali 15 lidí, kteří se psaním neživí (vyloučeni byli např. spisovatelé, žurnalisté, reklamní textaři...), aby předložili nějaký svůj text dlouhý 500 slov. Následně pak byli požádáni, aby popsali své okolí a přitom se snažili svůj styl zamaskovat. Ukázalo se, že řada stylometrického softwaru nedokáže tento „podvod“ odhalit. Tyto techniky přitom pracují různými metodami a navíc je kombinují – stanovuje se například průměrná délka slova, bohatství slovní zásoby („lexikální hustota“) či způsob používání interpunkce. Když se lidé ale snažili svůj styl maskovat, pravděpodobnost správného přiřazení ale nebyla vyšší než náhodná.
Ještě hůře to dopadlo, pokud dobrovolníci dostali za úkol imitovat styl Cormaca McCarthyho. Zde software téměř bez výjimky tvrdil, že je skutečným autorem textu.
Ukazuje se, že tímto způsobem se tedy lidé mohou nejen maskovat, ale lze takto i konstruovat falešná obvinění. Jiní vědci upozorňují, že uvedený výzkum zpochybnil stále jen ty jednodušší analytické metody (například by se autor textu dal prý stále odhalit analýzou používaných předložek – alespoň tedy v anglicky psaném textu). Z druhé strany ale platí, že dobrovolníci neměli žádné speciální lingvistické vzdělání ani informace o tom, jak stylometrický software pracuje. Těžko mohli nějak vědomě měnit preferované předložky, když vůbec netušili, že je to důležité. Expert by možná dokázal obelstít i sofistikovanější metody.
Zdroj: New Scientist
Poznámka: V tomto případě nejde o žádnou grafologii, tj. vše platí i pro texty vzniklé elektronicky.