Prediktivní analytika na kolenou? Volby v USA srazily její důvěryhodnost

11. 11. 2016

Že republikán Donald Trump porazí demokratku Hillary Clintonovou, nepředpokládala ani středoproudá media, ani volební průzkumy. Na první pohled vrhá takové zmýlení špatné světlo na některé z klíčových technologických sektorů jako je prediktivní analytika či big data.

Někteří odborníci však obavy mírní. Problém s průzkumy a anketami typu FiveThirtyEight tkví spíše ve sběru dat než v jeho zpracování, tvrdí.

Datová analytika v americkém prostředí již zafungovala, např. v Moneyball modelu pro baseballový klub Oakland Athletics, ale sport je něco jiného než volby, vysvětluje CRM analytik Denis Pombriant, zakladatel skupiny Beagle Research Group. Statistici sbírali spolehlivá baseballová data více než sto let, zatímco u volebních průzkumů je situace poněkud vrtkavější.

Všechna datová analytika závisí na „dobrých, čistých datech, a z tohoto důvodu by měla být aplikovaná obezřetně,“ popisuje ve středeční zprávě Pombriant. „Bez dávky opatrnosti bychom se rovnou mohli vrátit ke starému IT a statistickému rčení ‚odpad dovnitř, odpad ven.‘“

Průzkum nejsou skutečná big data, doplňuje Nik Rouda, analytik v Enterprise Strategy Group. „Velikost vzorků byla pro průzkumy jednoznačně dostačující, možná však nestačil objem dat a jejich rozmanitost v kontrastu s okamžitostí, strojovým učením a další pokročilou analytikou,“ popisuje v e-mailu. „Troufal bych si tvrdit, že využití vícero technik big dat by vytvořilo přesnější průzkumy.“

Je však pravdou, že většina průzkumů předpokládala vítězství Clintonové jen velmi těsně, přičemž velká část průzkumů se nachází uvnitř tolerované statistické odchylky. Je také dobré si povšimnout, že na celkový počet hlasů Clintonová zvítězila; nepřesnost se projevila u států, které dle průzkumů měla těsně vyhrát, avšak se tak nestalo.

Problém je tedy nejen v metodice průzkumů, ale i americkém volebním systémů, který je na podobná překvapení jako dělaný.

Podle profesora Samuela Wanga, manažera Princeton Election Consortium, které dávalo Clintonové 99% šanci na vítězství, zde však nehrála statistická odchylka roli. Průzkumy vyústily v „systematickou chybu,“ popsal Wang. „Celá skupina průzkumů byla mimo, celkově. Šlo o opravdu velký rozdíl, okolo 4 bodů na prezidentské a senátní úrovni.“

Prozatím Wang pokračuje v analýze dat; jeden z důvodu vzniklé analytické chyby podle něj může spočívat také v nerozhodnutých voličích.

Na začátku prezidentské kampaně bylo 20 % obvykle republikánských voličů nerozhodnutých, řekl Wang. „Pro ně byla volba Trumpa bitvou mezi loajalitou ke straně a reakcí na dosti radikálního kandidáta. Je možné, že u většiny z nich vyhrála loajalita.“

Jak Wang, tak Tony Baer, analytik big dat ve společnosti Ovum, si myslí, že průzkumu podcenily nejen nerozhodnuté, ale i těžko dosažitelné voliče. Pro tazatele je stále těžší vytipovat ty správné osoby do průzkumu. Někteří mohli také jednoduše lhát, dodal skrze e-mail.

Jak vidno, průzkumy nebyly zdaleka tak špatně, jak se může na první pohled zdát; roli sehrála těsnost souboje, americký volební systém, statistická odchylka i špatná práce s nerozhodnutými voliči a sběrem dat jako takovým. Faktem ale zůstává, že se zmýlily a je nutné dále pracovat na zpřesnění jakýchkoliv předpovědí.

Našli jste v článku chybu?

Sdílet

Autor článku

-ds

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už některé z inovativních metod šifrování?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Spěcháte na návratnost investic AI? Je možné, že to bude drahé

Vyšlo nové číslo CFOworldu 4/2024

Vivolink představí svoje ProAV a systémová řešení na veletrhu ISE 2025 v Barceloně

Nedostatečné zabezpečení koncových zařízení ohrožuje firmy

Co se v roce 2025 mění pro firmy, zaměstnance a daňové poplatníky?

Arrow Electronics je AWS Rising Star Distributor Partner roku v regionu EMEA

Jak zabránit zneužívání umělé inteligence – je AI Akt řešením?

Novela zákoníku práce pohledem firem? Rychlejší výpovědi a nedořešení dohodáři

AT Computers je IDG Distributorem roku společnosti Lenovo

Prediktivní analytika na kolenou? Volby v USA srazily její důvěryhodnost

Sdílet

Autor článku

-ds

Témata:

Mohlo by vás zajímat

Kybernetická bezpečnost: Podcast o tajemstvích bezpečnostních operačních center s Pavlem Hrabcem

Europol zatnul tipec hackerům, chystali hromadný útok během Vánoc

Co je nejoblíbenější způsob použití umělé inteligence v práci?

Předpověď kybernetických hrozeb pro rok 2025: Připravte se na větší a odvážnější útoky

Anketa

Využíváte už některé z inovativních metod šifrování?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Spěcháte na návratnost investic AI? Je možné, že to bude drahé

Vyšlo nové číslo CFOworldu 4/2024

Vivolink představí svoje ProAV a systémová řešení na veletrhu ISE 2025 v Barceloně

Nedostatečné zabezpečení koncových zařízení ohrožuje firmy

Co se v roce 2025 mění pro firmy, zaměstnance a daňové poplatníky?

Arrow Electronics je AWS Rising Star Distributor Partner roku v regionu EMEA

Jak zabránit zneužívání umělé inteligence – je AI Akt řešením?

Novela zákoníku práce pohledem firem? Rychlejší výpovědi a nedořešení dohodáři

AT Computers je IDG Distributorem roku společnosti Lenovo

Dále u nás najdete

Let's Encrypt příští rok nabídne certifikáty jen na šest dnů

Nové HDMI 2.2 už je za rohem

Neplaťte si IT kurzy sami, využijte dotace od EU

OpenAI zavádí do ChatGPT „Santa Mode“. Co říká na Ježíška?

Vánoce v minulosti: Oplzlé koledy, bujaré veselí a na večeři hrachová kaše.

Gynekologie zavedla poplatky, pacientky si to nenechaly líbit

Simona Kijonková: Dívala jsem se na investice za 1,4 miliardy

Zkuste vánoční cukroví bez cukru. 5 vyladěných receptů

Minimální mzda v roce 2025 vzroste, zaručená mzda končí

Adventní půst byl duchovní záležitostí. Teď se drží kvůli očistě

Tyhle věci nezapomeňte do konce roku udělat, ušetříte tisíce

Jaká jsou úskalí recenzí spotřebitele z pohledu podnikatele?

Při balení dárků nemusíte vůbec používat izolepu, dokonce ani papír

Co přináší nový Security World 4/2024?

Tuzemské cestovní náhrady v roce 2025

Kapr se dříve připravoval na modro. Dnes se hlavně smaží, vyzkoušejte podkovy

Ivanti dává hattrick třemi kritickými zranitelnostmi

Češi vyslali svařovacího robota do vesmíru

Nejistota pro podnikatele, zásadní změny DPH ještě nejsou schváleny

Češi mají aplikaci, která propojuje lidi podle společných koníčků