Z tweetů lze určit polohu odesilatele

17. 1. 2011

Nejde o geolokační software ani o sledování IP adresy. Příspěvky na Twitteru mohou podle jazykovědců se slušnou pravděpodobností napovědět ne sice přímo aktuální polohu uživatele, ale to, odkud pochází a kde žije.

Zdaleka přitom nejde jen o rozdíly mezi australskou a americkou angličtinou (nebo dejme tomu mezi pražským a ostravským dialektem češtiny). Odlišit se s poměrně slušnou pravděpodobností dají i dvě města na západním pobřeží USA, třena San Francisco a Los Angeles. Alespoň to tvrdí vědci z Carnegie Mellon University.
Zajímavé je, že Twitter v tomto má být specifický, z e-mailů, blogů nebo příspěvků na Facebooku se toho dá uhodnout mnohem méně. Údajně proto, že Twitter omezuje délku příspěvků na 140 znaků, čímž uživatele motivuje k používání všemožných zkratek či slangových výrazů, které se regionálně výrazně odlišují. Nakonec tedy o člověku tweet vypovídá asi tolik jako dialekt používaný v mluvené řeči. Na rozdíl od jiných psaných forem, kde se uživatelé uchylují k formálnějšímu jazyku, se zkráceniny na Twitteru objevují i v důsledku toho, že příspěvky bývají často přidávány z mobilních telefonů. Které zase mají často zapnuté geolokační služby a podle nich lze testovat, nakolik se jazykovědci při analýze textu skutečně trefili do reality. Do výzkumu bylo takto zahrnuto 9 500 uživatelů se zapnutou geolokací a celkem 380 000 příspěvků. Aby výzkumníci získali komplexnější vzorek používaného slovníku/jazyka, vyřadili ty uživatele, kteří napsali méně než 20 zpráv.
My, pro něž není angličtina rodným jazykem, se můžeme údajně přidržet např. následujících pouček: V severní Kalifornii se cool píše jako koo, zatímco v jižní spíše jako coo. Something se obvykle zkracuje na sumthin a z toho se moc dalšího poznat nedá, ale zkrácenina suttin s vysokou pravděpodobností ukazuje na New York. Ve Washingtonu se namísto obecné zkratky LOL (laughing out loud) používá spíše LLS. Very tired v obecné angličtině zase odpovídá hella (severní Kalifornie), af (Los Angeles) a deadass (New York). Jak se zdá, Internet tedy v rozporu s některými předpoklady nevede k jazykové homogenizaci. Podle vědců navíc platí, že přednostně zde komunikují lidé sobě podobní, a to včetně podobnosti používaných jazykových prostředků. Výměna dat tedy zcela „nezbořila hranice" a její intenzita odpovídá fungování reálného světa, globalizace má své limity.
Ještě zajímavější než zachycení statického stavu je to, že podobné analýzy umožní sledovat vývoj jazyka v reálném čase, osudy jednotlivých slov a zkratek, jejich šíření a umírání. Samozřejmě s tou výhradou, že uživatelé Twitteru představují jen specifický vzorek populace (např. z hlediska věku).
Práce týmu, který vedl postdoktorand na Carnegie Mellon University Jacob Eisenstein, je k dispozici zde.

Zdroj: Sciencedaily

Poznámka: Původní zdroj ovšem uvádí, že střední odchylka při určení polohy podle tweetu je v USA až 300 km. To by ve středoevropských poměrech neznamenalo žádnou zvláštní přesnost, ovšem USA jsou jazykově samozřejmě podstatně homogennější. Bylo by zajímavé zkusit takový výzkum provést i u nás.

Našli jste v článku chybu?

Pavel Houser

Témata:

twitter

Sdílet

Autor článku

Pavel Houser

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Správa firemního IT vybavení poháněná AI: Klíč k chytřejšímu IT a spokojenějším zaměstnancům

Třetí čtvrtletí letošního roku ryze českých investic

eD system obdržel cenu pro největšího distributora společnosti Oki

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Fortinet: Zaměstnanci jsou na tom s povědomím o kyberbezpečnosti hůř než vloni

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Canalys: Příprava na AI je v plném proudu, investice do cloudové infrastruktury vystřelily o 21 %

Z tweetů lze určit polohu odesilatele

Sdílet

Autor článku

Pavel Houser

Témata:

Mohlo by vás zajímat

Podcast: Kybernetická bezpečnost v Česku – dokážeme čelit novým hrozbám?

Windows Recall: Kontroverzní funkce sledující obrazovku má další zpoždění!

Co se dočtete v novém Computerworldu 11/2024?

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Správa firemního IT vybavení poháněná AI: Klíč k chytřejšímu IT a spokojenějším zaměstnancům

Třetí čtvrtletí letošního roku ryze českých investic

eD system obdržel cenu pro největšího distributora společnosti Oki

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Fortinet: Zaměstnanci jsou na tom s povědomím o kyberbezpečnosti hůř než vloni

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Canalys: Příprava na AI je v plném proudu, investice do cloudové infrastruktury vystřelily o 21 %

Dále u nás najdete

Osvědčené způsoby, jak snížit vysoký krevní tlak

Stojíme na rozcestí, kde jde o víc než o procenta emisních cílů, říkají lidé z automotive. V něm za čtyři roky reálně zaniklo 56 tisíc míst

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Oznámení o osvobozených příjmech: shrnutí povinností

Opatrně s kofeinovým práškem, už jedna lžička je životu nebezpečná

Je možné vyhrát nad Temu? Prodejci her se to podařilo

Vyzkoušeli jsme test, který ukazuje, co jsme zdědili po předcích

Digitální transformace znamená neustálé změny a úpravy

Opakující se melodii v hlavě zkuste zahnat žvýkačkou

Svařák bez alkoholu je skvělá varianta pro těhotné či abstinenty

Když malý usnul, otevírala notebook. Nyní má úspěšný byznys

USA zastavují dodávky pokročilých AI čipů TSMC do Číny

Horké nápoje: Zkuste recepty na šest nejznámějších

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

Otestujte, jak znáte reklamní slogany

Vánoční slevy operátorů? Daleko za očekáváním

Stow vytváří regálové systémy pro Alzu, Lidl i Rohlík

Windows chystá offline AI vyhledávání souborů

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Podnikatelé s nižšími příjmy si za celý rok připlatí skoro o 13 tisíc víc