| dbpprop:abstract
|
- For the human linguistic concept, see Speech perception Speech recognition (also known as automatic speech recognition or computer speech recognition) converts spoken words to machine-readable input (for example, to key presses, using the binary code for a string of character codes). The term "voice recognition" is sometimes used to refer to speech recognition where the recognition system is trained to a particular speaker - as is the case for most desktop recognition software, hence there is an aspect of speaker recognition, which attempts to identify the person speaking, to better recognise what is being said. Speech recognition is a broad term which means it can recognise almost anybodys speech - such as a callcentre system designed to recognise many voices. Voice recognition is a system trained to a particular user, where it recognises their speech based on their unique vocal sound. Speech recognition applications include voice dialing (e.g. , "Call home"), call routing (e.g. , "I would like to make a collect call"), domotic appliance control and content-based spoken audio search (e.g. , find a podcast where particular words were spoken), simple data entry (e.g. , entering a credit card number), preparation of structured documents (e.g. , a radiology report), speech-to-text processing, and in aircraft cockpits.
- Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik und der Ingenieurwissenschaften. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation. Allerdings ähneln sich die Realisierungen dieser Verfahren.
- El Reconeixement Automàtic del Parla (RAP) o Reconeixement Automàtic de veu és una part de la Intel·ligència Artificial que té com a objectiu permetre la comunicació parlada entre éssers humans i computadores electròniques. El problema que es planteja en un sistema de RAP és el de fer cooperar un conjunt d'informacions que provenen de diverses fonts de coneixement (acústica, fonètica, fonològica, lèxica, sintàctica, semàntica i pragmàtica), en presència d'ambigüitats, incerteses i errors inevitables per arribar a obtenir una interpretació acceptable del missatge acústic rebut.
- Rozpoznávání řeči je postup, kdy se podle určitých zaznamenaných vzorků zvuku rozpoznává, co bylo řečeno. Metoda je zatím velmi citlivá na rozdíly v intonaci i výslovnosti. Nejvíce propracovaná je tato metoda zatím pro anglicky mluvící populaci. I když mají mluvčí stejný jazyk, liší se jejich hlasový projev právě v různé intonaci, zabarvení atd. Tyto rozdíly se snaží překonat složité výpočetní operace, takže proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči. Už dnes však existují programy, které reagují na jednoduché hlasové povely. Existují dokonce textové editory, kterým lze text diktovat. V současnosti nejrozšířenějším software v této oblasti je Dragon Naturally Speaking a IBM ViaVoice. V prográmku jménem JetVoíce můžete ovládat hlasem některé činnosti počítače. Hlasové záznamy jsou v něm vidět v obrazové podobě, kde můžete rozpoznat jak vaše intonace závratně mění způsob, jakým počítač zvuk vnímá.
- El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras electrónicas. El problema que se plantea en un sistema de RAH es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido. Un sistema de reconocimiento de voz es una herramienta computacional capaz de procesar la señal de voz emitida por el ser humano y reconocer la información contenida en ésta, convirtiéndola en texto u emitiendo órdenes que actúan sobre un proceso. En su desarrollo intervienen diversas disciplinas, tales como: la fisiología, la acústica, el procesamiento de señales, la inteligencia artificial y la ciencia de la computación.
- Puheentunnistus on joukko kieli- ja puheteknologian alaan kuuluvia hahmontunnistusmenetelmiä, joiden avulla tietokone voi tunnistaa ihmisten puhetta. Puheentunnistusmenetelmien avulla voidaan esimerkiksi valmistaa puheohjattavia laitteita tai taltioida puhetta tekstimuotoiseksi.
- La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d'analyser un mot ou une phrase captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance vocale, ainsi que la synthèse vocale, l'identification du locuteur ou la vérification du locuteur, font partie des technologies de traitement de la parole. Ces technologies permettent notamment de réaliser des interfaces vocales c'est-à-dire des interfaces homme-machine (IHM) où une partie de l'interaction se fait à la voix. Parmi les nombreuses applications, on peut citer les applications de dictée vocale sur PC où la difficulté tient à la taille du vocabulaire et à la longueur des phrases, mais aussi les applications téléphoniques de type serveur vocal, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics).
- Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale. Sistemi di riconoscimento vocale vengono utilizzati per applicazioni vocali automatizzate nel contesto delle applicazioni telefoniche, ad esempio call center automatici, per sistemi di dettatura (in inglese dictation systems), che consentono di dettare discorsi al computer, oppure per sistemi di controllo del sistema di navigazione satellitare o del telefono in auto tramite comandi vocali.
- 音声認識(おんせいにんしき, speech recognition)は、ヒトの話す音声言語をコンピュータによって解析し、話している内容を文字データとして取り出す処理のこと。キーボードからの入力に代わる文字入力方法として注目を集めている。 音声認識に関連が深い技術として、あらかじめ記録しておいた音声パターンと比較して個人認証等をおこなう、話者認識がある。 パソコンの場合、文章を入力する用途では音声入力またはディクテーション、アプリケーションの操作は音声操作と呼ばれる。
- Spraakherkenning maakt het mogelijk een computerterminal te bedienen met behulp van de menselijke stem.
- Talegjenkjenning kalles prosessen å gjenkjenne menneskelig tale av en maskin. Denne teknologien gjør det mulig å styre en maskin ved hjelp av tale. Gjenkjenningen skjer vanligvis ved hjelp av et dataprogram som igjen styrer andre programmer eller utstyr koblet til datamaskinen. Mennesker med fysiske funksjonsnedsettelser, som ikke kan styre en datamaskin ved hjelp av tastatur og mus, kan ha spesiell utbytte av talegjenkjenning.
- Rozpoznawanie mowy - technologia pozwalająca komputerowi wyposażonemu w urządzenie do próbkowania dźwięku interpretować mowę ludzką, na przykład do celów transkrypcji lub jako alternatywną metodę interakcji z komputerem. Wyróżnia się kilka rodzajów rozpoznawania mowy: rozpoznawanie pojedynczych fonemów rozpoznawanie izolowanych słów rozpoznawanie łączonych słów oraz rozpoznawanie mowy ciągłej Obecnie dla języka polskiego dostępne są programy rozpoznające poprawnie 5-9 na 10 wypowiedzianych słów.
- Tecnologias de reconhecimento da fala permitem que computadores equipados com microfones interpretem a fala humana, por exemplo, para transcrição ou como método de comando por voz. Tais sistemas podem ser classificados por requererem, ou não, que o usuário treine o sistema a reconhecer seus padrões particulares de fala, por ter a habilidade de reconhecer fala contínua ou por requerer que o usuário fale pausadamente, e pelo tamanho do vocabulário que é capaz de reconhecer (pequeno, da ordem de dezenas a centenas de palavras, ou grande, com milhares de palavras). Sistemas que requerem pouco treinamento podem capturar continuamente a fala com um amplo vocabulário, em ritmo normal, com precisão de cerca de 98% (duas palavras erradas em cem) enquanto sistemas que não requerem treinamento podem reconhecer um número pequeno de palavras como, por exemplo, os dez dígitos do sistema decimal. Tais sistemas são populares por direcionar chamadas telefônicas recebidas, em grandes organizações, aos seus destinos. Sistemas comerciais para reconhecimento da fala têm estado disponíveis desde os anos 90, porém é interessante notar que, apesar do aparente sucesso dessa tecnologia, poucas pessoas os usam. Parece que a maioria dos usuários de computador pode criar e editar documentos mais rapidamente com um teclado convencional, apesar do fato de que muitas pessoas são capazes de falar consideravelmente mais rápido do que podem digitar. Além disso, o uso intenso dos órgãos da fala pode resultar em sobrecarga vocal. Alguns dos problemas técnicos chaves do reconhecimento da fala são: Diferenças entre os interlocutores são freqüentemente grandes e dificultam. Não está claro quais características da fala são independentes do falante. A interpretação de vários fonemas, palavras e frases é sensível ao contexto. Por exemplo: os fonemas são geralmente mais curtos em palavras longas do que em palavras pequenas. As palavras têm significados diferentes em frases diferentes. Por exemplo: "Philip lies" pode ser interpretado como Philip sendo um mentiroso ou como Philip deitando-se na cama. A entonação e o timbre da fala podem mudar completamente a interpretação de uma palavra ou frase. Por exemplo: "Vai!", "Vai?" e "Vai. " podem ser claramente reconhecidos por um humano, mas não tão facilmente por um computador. Palavras e frases podem ter várias interpretações válidas de modo que o falante deixe a escolha da correta para o ouvinte. A linguagem escrita precisa de pontuação de acordo com regras estritas que não estão fortemente presentes na fala e são difíceis de inferir sem conhecer o significado (vírgulas, fim de frase, citações). O entendimento do significado das palavras ditas é pensado como um campo separado do entendimento natural da linguagem. Há vários exemplos de frases que soam iguais e só podem ser desambiguadas pela aparição do contexto: uma famosa camisa vestida por pesquisadores da Apple dizia "I helped Apple wreck a nice beach" [Eu ajudei a Apple a destruir uma bela praia], o que, quando pronunciado, soa como "I helped Apple recognize speech" [Eu ajudei a Apple a reconhecer a fala]. Uma solução geral para muitos dos problemas acima requer efetivamente conhecimento humano, experiência e uma avançada tecnologia em inteligência artificial. Especificamente, modelos estatísticos de linguagem são freqüentemente empregados para desambiguação e melhoramento da precisão do reconhecimento.
- Recunoaşterea vocală este procesul de convertire a cuvintelor vorbite în format digital care poate fi utilizat ulterior pentru tipărire, arhivare, căutare. Termenul de recunoaştere vocală poate însemna şi recunoaşterea vorbitorului. Domeniile de aplicabilitate sunt: Medicină, Armată (comenzi vocale pentru aparate de zbor), antrenarea controlorilor de zbor şi pentru persoanele cu handicap.
- Распознавание речи — набор технологий, позволяющих управлять компьютером, используя человеческий голос.
- Taligenkänning, ASR (engelska Automatic Speech Recognition), kallas processen att elektroniskt eller datatekniskt känna igen mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer. Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Det bedrivs omfattade forskning kring förståelsen av naturligt tal. Moderna taligenkänningssystem bygger oftast på statistiska metoder där tal tolkas i flera nivåer med hjälp av hypoteser och grammatiker som definierar troliga/kända kombinationer av språkelement. I mer avancerade system är dessa modeller ofta adaptiva och därmed öppna för inlärning av nya grammatikelement genom en halvautomatisk analys av vilka fraser som misslyckas att bli korrekt förstådda, följt av korrigering av de grammatiska och akustiska modellerna. Nivåer i ASR: akustik - identifiering av fonem, dvs ljudstyrka för frekvenserkombinationer och akustiskt förlopp ord - ihopsättning av fonem ordföljder - urval av troligaste ordföljder jämfört med en stor databas med talat språk grammatik - verifiering av hypotetiska ordföljder mot grammatik som gäller för det specifika domänen (till exempel en grammatik för biljettbokningar innhåller vanliga fraser och meningar som har med biljetter att göra, men det finns ingen anledning att till exempel ha med grammatik för fotbollsammanhang) semantik - uttydning av informationsbärande element Enklare ASR förväntar sig enkla svar på frågor, till exempel Fråga: Vart vill du åka? Ange orten! Svar: Malmö Fråga: Varifrån vill du åka? ange orten! Svar: Kiruna ASR som kan hantera fritt tal kan under optimala omstämdigheter klara av komplicerade utsagor som till exempel: Fråga: Beskriv din resa! Svar: Jag vill ta tåget från Kiruna till Malmö, andra klass. Då folk inte talar grammatiskt, och ofta stakar sig så måste man kunna filtrera bort harklingar, upprepade ord, otydliga ord, ord utan betydelse, till exempel Svar: Hmmm Ja just det, vi tar tåget, ta tåget från.. från öööö Kiru.. Kiruna var det till Skåne, till Malmö, ja just det till öööö Malmö skall jag åka.
- Розпізнавання мови — набір технологій, які дозволяють керувати комп'ютером, використовуючи людський голос. Комерційні програми з розпізнаванню голосу з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується. Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ. Ще однією цікавою програмою є Speereo Voice Translator — голосовий перекладач. SVT здатна розпізнавати фрази, вимовлені англійською мовою, і "говорити" у відповідь переклад на одній з вибраних мов. Інтелектуальні мовні прикладні програми, що дозволяють автоматично синтезувати і розпізнавати людську мову, є наступним етапом розвитку інтерактивних голосових систем IVR. Використання інтерактивного телефонного програмного забезпечення в даний час є не даниною моді, а життєвою необхідністю. Зниження навантаження на операторів контакт-центрів і секретарів, скорочення витрат на оплату праці і підвищення продуктивності систем обслуговування — ось тільки деякі переваги, що доводять доцільність подібних програм. Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мови. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню.
- 语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
|
| rdfs:comment
|
- For the human linguistic concept, see Speech perception Speech recognition (also known as automatic speech recognition or computer speech recognition) converts spoken words to machine-readable input (for example, to key presses, using the binary code for a string of character codes).
- Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik und der Ingenieurwissenschaften. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation.
- El Reconeixement Automàtic del Parla (RAP) o Reconeixement Automàtic de veu és una part de la Intel·ligència Artificial que té com a objectiu permetre la comunicació parlada entre éssers humans i computadores electròniques.
- Rozpoznávání řeči je postup, kdy se podle určitých zaznamenaných vzorků zvuku rozpoznává, co bylo řečeno. Metoda je zatím velmi citlivá na rozdíly v intonaci i výslovnosti. Nejvíce propracovaná je tato metoda zatím pro anglicky mluvící populaci. I když mají mluvčí stejný jazyk, liší se jejich hlasový projev právě v různé intonaci, zabarvení atd.
- El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras electrónicas.
- Puheentunnistus on joukko kieli- ja puheteknologian alaan kuuluvia hahmontunnistusmenetelmiä, joiden avulla tietokone voi tunnistaa ihmisten puhetta. Puheentunnistusmenetelmien avulla voidaan esimerkiksi valmistaa puheohjattavia laitteita tai taltioida puhetta tekstimuotoiseksi.
- La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d'analyser un mot ou une phrase captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance vocale, ainsi que la synthèse vocale, l'identification du locuteur ou la vérification du locuteur, font partie des technologies de traitement de la parole.
- Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale.
- Spraakherkenning maakt het mogelijk een computerterminal te bedienen met behulp van de menselijke stem.
- Talegjenkjenning kalles prosessen å gjenkjenne menneskelig tale av en maskin. Denne teknologien gjør det mulig å styre en maskin ved hjelp av tale. Gjenkjenningen skjer vanligvis ved hjelp av et dataprogram som igjen styrer andre programmer eller utstyr koblet til datamaskinen. Mennesker med fysiske funksjonsnedsettelser, som ikke kan styre en datamaskin ved hjelp av tastatur og mus, kan ha spesiell utbytte av talegjenkjenning.
- Rozpoznawanie mowy - technologia pozwalająca komputerowi wyposażonemu w urządzenie do próbkowania dźwięku interpretować mowę ludzką, na przykład do celów transkrypcji lub jako alternatywną metodę interakcji z komputerem.
- Tecnologias de reconhecimento da fala permitem que computadores equipados com microfones interpretem a fala humana, por exemplo, para transcrição ou como método de comando por voz.
- Recunoaşterea vocală este procesul de convertire a cuvintelor vorbite în format digital care poate fi utilizat ulterior pentru tipărire, arhivare, căutare. Termenul de recunoaştere vocală poate însemna şi recunoaşterea vorbitorului. Domeniile de aplicabilitate sunt: Medicină, Armată (comenzi vocale pentru aparate de zbor), antrenarea controlorilor de zbor şi pentru persoanele cu handicap.
- Распознавание речи — набор технологий, позволяющих управлять компьютером, используя человеческий голос.
- Taligenkänning, ASR (engelska Automatic Speech Recognition), kallas processen att elektroniskt eller datatekniskt känna igen mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer. Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Det bedrivs omfattade forskning kring förståelsen av naturligt tal.
- Розпізнавання мови — набір технологій, які дозволяють керувати комп'ютером, використовуючи людський голос. Комерційні програми з розпізнаванню голосу з'явилися на початку дев'яностих років.
|