Skip to main content

Kaj je prepoznavanje govora?

Anonim

Prepoznavanje govora je tehnologija, ki omogoča govorne vnose v sisteme. Pogovorite se z računalnikom, telefonom ali napravo in uporablja to, kar ste rekli kot vhod, da sprožite nekaj dejanj. Tehnologija se uporablja za zamenjavo drugih metod vnosov, kot so tipkanje, klicanje ali izbiranje na druge načine. To je sredstvo, s katerim pripomočke in programsko opremo naredite bolj prijazno uporabnikom in povečate produktivnost.

Obstaja veliko aplikacij in področij, kjer se uporablja prepoznavanje govora, vključno z vojsko, kot pomoč za oslabljene osebe (zamislite osebo s pohabljenimi ali brez rok ali prstov), ​​na medicinskem področju, v robotiki itd. V bližnji prihodnosti, skoraj vsi bodo izpostavljeni prepoznavanju govora zaradi razširjanja med običajnimi napravami, kot so računalniki in mobilni telefoni.

Nekateri pametni telefoni zanimivo uporabljajo prepoznavanje govora. Primeri tega so naprave iPhone in Android. Z njimi lahko pokličete stik, tako da preprosto dobite govorna navodila, kot je »Klicni urad«. Lahko se zabavajo tudi drugi ukazi, kot je "Vključi Bluetooth."

Težave z prepoznavanjem govora

Prepoznavanje govora, v svoji različici, znani kot Govor v besedilo (STT), je bilo že dolgo časa uporabljeno za prevajanje izgovorjenih besed v besedilo. "Govoriš, to tipi", kot bi rekel ViaVoice na svojem polju. Ampak obstaja ena težava s STT, kot jo poznamo. ViaVoice je eden najboljših v industriji, zato si predstavljajte ostalo. Tehnologija je dozorela in izboljšala, vendar govor v besedilo še vedno ljudi postavlja vprašanja. Ena od njenih glavnih težav je ogromna razlika med ljudmi pri izgovarjanju besed.

V prepoznavanju govora naj ne bi bili vsi jeziki, pogosto pa ne podpirajo tudi angleščine. Kot rezultat, večina naprav, ki vodijo programsko opremo za prepoznavanje govora, opravljajo razumno le v angleščini.

V nizu zahtev strojne opreme je v določenih primerih prepoznavanje govora težko razporediti. Potrebujete mikrofon, ki je dovolj inteligenten za filtriranje hrupa v ozadju, hkrati pa dovolj močan za glasovno naravo glasu.

Ko govorimo o ozadju hrupa, lahko povzroči, da celoten sistem ne uspe. Posledica tega je, da prepoznavanje govora v mnogih primerih ni uspelo zaradi hrupa, ki je zunaj uporabnika.

Pripoznavanje govora je boljše kot vhodna metoda za nove telefone in komunikacijske tehnologije, kot je VoIP, kot orodje za produktivnost za množični vnos besedila.

Uporaba prepoznavanja govora

Tehnologija postaja priljubljena na številnih področjih in je bila uspešna v naslednjih primerih:

  • Nadzor naprave. Pravi, da »OK Google« na telefon s sistemom Android sproži sistem, ki je vse ušesa vašim glasovnim ukazom.
  • Avtomobilski sistemi Bluetooth. Mnogi avtomobili so opremljeni s sistemom, ki povezuje svoj radijski mehanizem s svojim pametnim telefonom prek povezave Bluetooth. Nato lahko kličete in sprejemate klice, ne da bi se dotaknili vašega pametnega telefona, in lahko celo pokličete številke, tako da jih preprosto izgovorite.
  • Govorni prepis. Na področjih, kjer ljudje veliko vnašajo, nekatere inteligentne programske opreme zajebejo svoje izgovorjene besede in jih prepisujejo v besedilo. To je trenutno v določeni programski opremi za obdelavo besedil. Prenos govora deluje tudi z vizualno glasovno pošto.