Intel čte slova ze rtů

Společnost Intel uvolnila pod otevřenou licencí software, který dokáže odečítat slova ze rtů. Měly by se tím zvýš...


Společnost Intel uvolnila pod otevřenou licencí software, který dokáže odečítat
slova ze rtů. Měly by se tím zvýšit schopnosti počítačů při rozpoznávání
mluvené řeči.
Spolehlivost dnešních systémů pro automatické rozpoznávání hlasu závisí na
hladině okolního hluku/šumu. Na veřejných prostranstvích s větší mírou
cizorodých zvuků přesnost současných algoritmů podstatně klesá. Vědci ve
společnosti Intel nyní proto vyvíjejí software označovaný jako AVSR (Audio
Visual Speech Recognition), který dokáže identifikovat obličej mluvčího a
sledovat pohyb jeho úst. Rozpoznávání hlasu bude doplňováno rozpoznáváním
obrazu, přesněji odezíráním ze rtů; počítače vybavené těmito systémy se tak
přiblíží způsobu, kterým řeč vnímají i samotní lidé.
Software AVSR je součástí knihovny OpenCV. Zdrojový kód této knihovny v jazyce
C je k dispozici bezplatně a je možné ho dále distribuovat. Intel uvádí, že od
uvedení první verze knihovny v roce 2000 se zdrojový kód dočkal více než půl
milionu downloadů. Další informace lze najít na adrese
http://www.intel.com/research/mrl/research/opencv/.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.