Platforma DNA vytváří finanční big data, využití nalézá i ve strojovém učení

11. 1. 2019

Sdílet

 Autor: (c) petrovich12 - Fotolia.com
Dow Jones, legendární americká společnost zaměřená na finanční novinky, zpravodajství a tržní statistiky, se nyní vypravila i do oblasti big dat a strojového učení.

Platforma nazvaná DNA – Data, News and Analytics platform (zkratka související s deoxyribonukleovou kyselinou není náhodná) – je datová služba, která umožňuje jejím klientům extrahovat existující data ve velkém množství a v reálném čase. Mezi velké zákazníky této platformy, která sice běží už od března 2017, ale stále ještě neopustila beta testování, patří důležití hráči v odvětvích typu biologického sledování, pojišťovnictví a kapitálových trhů.

„Před několika lety jsme si uvědomili, že jak interně, tak na trhu potřebujeme snadno poskytovat všechna naše skvělá data, která máme, a snáze je dodávat našim podnikovým klientům – systematicky a programově,“ vysvětlil generální manažer DNA platformy v Dow Jones Niranjan Thomas pro britský Computerworld.

 

Platforma je určena pro velké podniky

Služba funguje primárně na základě různých API, které informace plynule přenáší různorodými kanály. Vzhledem k širokému množství produktů, které firma používá k šíření informací – od své agenturní služby Newswire, přes webové stránky Factiva.com a VentureSource až po publikaci zpravodajství skrze Wall Street Journal, je potřeba poskytování dat logicky a systematicky rozdělit.

Vznik platformy DNA souvisí také s proměnou, jakým způsobem zákazníci data využívají.

„Cloud je nejvýznamnějším pohonem této změny. Umožňuje obzvláště velkým podnikovým zákazníkům zpracovávat dříve nevídané množství dat a dosáhnout opravdu vysoké úrovně vhledu do daného tématu, což dříve nebylo možné,“ dodává Thomas.

I domovem DNA je cloud, třetí strany tak mohou stahovat miliony nebo desítky milionů dokumentů najednou; praxe ideální pro projekty strojového učení, které se potřebují trénovat na velkém počtu souborů.

bitcoin školení listopad 24

Platforma nabízí dva druhy API: jedny umožňují extrémně rychlý přenos velkého množství dat, „streamovací“ API zase přenos dat v reálném čase. K dispozici jsou také specifičtější API, třeba takové, které organizacím a jednotlivcům umožňují vyhledávat specifické články.

Na principu měsíčního poplatku fungující platforma navíc nedodává zákazníkům pouze data od Dow Jones a jejích služeb, ale také informace od třetích stran, jmenovitě např. Reuters nebo New York Times.