Software, který změní hlas v data

Ve světě softwaru rozpoznávajícího řeč se mnoho změnilo. Pryč jsou dny, kdy jsme museli takové programy celé hodiny...


Ve světě softwaru rozpoznávajícího řeč se mnoho změnilo. Pryč jsou dny, kdy
jsme museli takové programy celé hodiny učit tomu, co říkáme, aby se
přizpůsobily našemu hlasu a byly přesnější.
Důležitá je rovněž skutečnost, že nové verze softwaru od IBM ViaVoice for
Windows Pro Edition (stojí 200 dolarů, www.ibm.com) a Lernout & Hauspie Dragon
NaturallySpeaking Preferred 5.0 (stojí 199 dolarů, www.dragonsys.com), které
jsme měli možnost testovat, dokázaly značně zkrátit celý proces konverze.
Po zátěžovém rozpoznávacím maratonu, sérii testů, které jsme aplikovali na oba
programy, vyplynulo, že software NaturallySpeaking rozpoznává slova lépe,
zpracovává diktáty rychleji a obecně je pro práci jednodušší. Nicméně ViaVoice
nabízí některé funkce, které konkurenci chybějí.
Nástroje pro mluvení
Požadavky na hardware jsou u programu IBM trošku náročnější než u L&H. Abyste
mohli spustit ViaVoice na jakékoli verzi Windows, potřebujete mít ve svém PC
nainstalován nejméně procesor Pentium II 300 MHz nebo AMD-K6. Naproti tomu,
abyste mohli používat NaturallySpeaking, potřebujete Pentium II 266 MHz nebo
AMD K6-2. Samotná instalace v případě ViaVoice z vašeho pevného disku ukrojí
celých 510 MB, program dále požaduje 48 MB operační paměti a Windows 95/98/Me.
U Windows NT stoupá nárok na operační paměť na 64 MB (Service Pack 5 je
podmínkou) a u Windows 2000 pak až na 96 MB. NaturallySpeaking je mnohem
skromnější, vyžaduje 150 MB volného prostoru na pevném disku a 64 MB paměti RAM
nezávisle na platformě. Abyste mohli oba produkty používat, nesmí ve vašem
počítači chybět standardní 16bitová zvuková karta se vstupem pro mikrofon, nebo
USB port pro použití USB mikrofonu.
Oba produkty se dodávají s vysoce kvalitními sluchátky, které eliminují šum.
IBM nabízí sluchátka Andrea Anti-Noise NC-61 sluchátka s pohodlnou masivní
čelenkou a sluchadly příjemnými pro uši. Tato sluchátka můžete také připojit k
USB adaptéru a audiosestavě, která vám umožní obejít zvukový vstup vašeho
počítače, což se může hodit např. uživatelům notebooků, které jsou nechvalně
známé svou velmi špatnou kvalitou zvukového vstupu/výstupu. L&H dodává oproti
IBM poněkud chatrná sluchátka Telex, které mají čelenku z tenkého kovového
proužku.
Oba produkty nabízejí velmi jednoduché pomocníky k instalaci, kteří fungují
mnohem lépe než jejich předchůdci. L&H vám nabídne zábavnějšího tréninkového
experta např. výběr z Charlie and the Chocolate Factory a Dogberts Top Secret
Management Handbook. IBM pro trénink nabízí Treasure Island a pomůcku Growing
Up Digital.
Software jsem testoval pomocí diktování série e-mailů, pracovních reportů a
novinových článků. Test jsem prováděl na notebooku s procesorem Pentium III-600
MHz osazeným 256 MB paměti RAM a na stolním počítači v konfiguraci: Pentium II
400, 64 MB RAM. A ještě na počítači Pentium II 333 MHz se 96 MB paměti RAM.
Překvapením jistě nebylo, že notebook s P III 600 byl ve výsledcích nejlepší a
zpracoval mé slovní hříčky do textu nejlépe.
Ačkoli NaturallySpeaking a ViaVoice nyní vyžadují náročnější "trénink", o to
více je oceníte, protože čím více tento produkt používáte, tím lépe software
rozeznává vaši výslovnost. Oba programy se časem zlepšily, díky pravidelnému
používání a zadávání správných výrazů pro slova, která byla chybně převedena.

Přenos v praxi
ViaVoice i NaturallySpeaking nebyly bez chyb, ViaVoice toho zkazil více zvláště
po aplikaci nových slov. Některé z chyb: NaturallySpeaking zapsal "Heidi" místo
"Hi", "gosh" místo "Scott" a "Elkin age" místo "L&H". A když jsem zadal příkaz
"Insert exclamation point," program mi nerozuměl a myslel si, že diktuji a
zapsal "excavation point" namísto vypuštění předtím zapsaného slova. ViaVoice
převrátil "stuff" na "dove", zaměnil "thanks" za "punks", "Harry" za "hardy" a
"trade shows" za "ratios".
Oblíbená úloha editování hlasem byla velmi jednoduchá s oběma testovanými
produkty, ale i zde je ještě hodně k vylepšení. Příkazy jako "Move to the top
of document" nebo "Make this paragraph courier bold red" byly příležitostně
zpracovány jako diktát a ne jako formátovací instrukce, což se stávalo zejména
u produktu ViaVoice. Oprava špatně zapsaných slov pomocí hlasu byla snazší a
účinnější s produktem NaturallySpeaking např. příkaz "Select [špatně zapsané
slovo]" a potom příkaz "Correct that". ViaVoice má velmi užitečného pomocníka
pro rozpoznávání hlasu, který přichází na scénu, pokud máte problémy. Nabídne
mnoho užitečných scénářů, které vám napoví, v čem je chyba a proč jisté úkony
nefungují.

Integrace
A se kterými programy testované produkty můžete používat? Oba vám umožní
diktovat do programů Microsoft Word a Excel 97/2000, Corel WordPerfect 8 a 9,
Outlook Express 97/98/2000 a AOL 4.0. Program NaturallySpeaking rovněž pracuje
s programy Goldmine, AOL 5.0, Eudora a Netscape Messenger 4.73. Ale v porovnání
s aplikacemi integrovanými přímo do programů NaturallySpeaking a ViaVoice je
proces diktování do těchto dalších programů Windows asi dvakrát pomalejší a
vyskytuje se zde rovněž více chyb.
Prohlížení Internetu pomocí hlasových příkazů je vylepšeno u obou produktů už
nejste limitováni na příkazy vpřed, zpět. Internet Explorer a ViaVoice vám nyní
umožní přistupovat k odkazům ve vaší složce oblíbených odkazů pomocí příkazu
"Jump to Computerworld". Surfování po Internetu pomocí příkazů "page up", "page
down" a vyslovování hyperlinků fungovalo dobře na obou produktech.
Pokud bych byl donucen vybrat si jeden z těchto dvou rivalů na trhu, vybral
bych si Dragon NaturallySpeaking a zahodil bych přiložená sluchátka zvlášť
pokud bych preferoval spolehlivost před cenou. Snadno si dnes můžete koupit
lepší včetně mikrofonu za cenu kolem 40 dolarů.
1 0568 / zaj









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.