Už přes sto let vybírá a přerozděluje Ochranný svaz autorský poplatky autorům hudby za užití jejich děl. Zatímco původně agentura spoléhala na rozsáhlý katalogový lístek a náročnou ruční práci, počítače toto velké břímě sňaly z lidských ramen.
Jak přesně funguje vyhledávání a určování výše odměn jednotlivým zastupovaným autorům vysvětluje v našem podcastu Miroslav Slavík, který vede IT oddělení Ochranného svazu autorského (OSA). Svaz na základě licence ministerstva kultury zastupuje autory textů hudby a na základě smlouvy s dalšími kolektivními správci zajišťuje jediné kontaktní místo pro uživatele chráněného obsahu, kde si mohou vyřídit a zpracovat, vše co potřebují. Získané poplatky pak autorům přerozděluje.
Celý podcast si můžete pustit zde:
„Hudbu rozdělujeme na adresnou a neadresnou. První se hraje třeba na koncertech a druhá třeba v rádiích, kdy samozřejmě nevíme, kdo jakou skladbu poslouchal,“ vysvětluje Miroslav Slavík. Provozovatelé hudebních vystoupení, majitelé rádií a televizí, ale také streamovací společnosti musejí OSA předávat informace o použité hudbě.
OA shromažďuje informace o hudbě přehrané v rádiích, koncertech nebo televizích na českém území a o stažených či streamovaných skladbách na území Evropy.
„Každá skladba má svůj jasný identifikátor. Ovšem ne všichni hudební producenti nám dodávají informace o skladbách v ideálním stavu. Pokud to jde, porovnáváme dodané údaje pomocí našich IT systémů, občas ale musíme informace dohledávat ručně v našem specializovaném oddělení pro dohledávání dat, tak abychom byli co nejpřesnější a co nejdříve vyplatili odpovídající odměny autorům. Nyní je vyplácíme každý měsíc,“ popisuje Slavík.
Pro rozdělování vybraných peněz používá OSA různé metody na rozpočítání autorských odměn za pomoci složitých a stále optimalizovaných algoritmů. OSA disponuje repertoárem zhruba 3,5 milionu skladeb. Ten je uložen v databázi Oracle, které běží na interních serverech. Databáze pak ročně porovná tento repertoár s necelými dvanácti miliardami dodaných informací od hudebních producentů, aby našla kýženou shodu a mohla spočítat kdo jakou dostane odměnu.
„Není to úplně jednoduché a nikdy to nebude stoprocentní. Porovnáváme miliardy záznamů zejména ze streamovacích služeb s naším repertoárem, kde se v několika krocích snažíme co nejpřesněji identifikovat skladby, které si někdo pustil třeba do sluchátek. Nyní nám běží v testovacím režimu projekt, kde se snažíme vylepšit párování pomocí kontextových indexů a nástrojů, které třeba vypočítávají podobnost jednotlivých slovních spojeních či datových fragmentů, tak aby to bylo co nejpřesnější, ale zároveň jsme neměli příliš mnoho false positive či false negativ výsledků,“ popisuje Miroslav Slavík v podcastu.
Jak přesně probíhá vyhledávání skladeb a jejich párování, nebo používání umělé inteligence? Toto a mnoho dalšího zajímavého se dozvíte v našem podcastu.
Příjemný poslech.
Podcast vznikl za podpory společnosti Oracle.