responds to questions, i.e. "Where are you?" or statements, i.e. "Hello."]]Speech recognition (also known as automatic speech recognition or computer speech recognition) converts spoken words to machine-readable input (for example, to keypresses, using the binary code for a string of character codes).

PropertyValue
p:abstract
  • responds to questions, i.e. "Where are you?" or statements, i.e. "Hello."]]Speech recognition (also known as automatic speech recognition or computer speech recognition) converts spoken words to machine-readable input (for example, to keypresses, using the binary code for a string of character codes). The term voice recognition may also be used to refer to speech recognition, but more precisely refers to speaker recognition, which attempts to identify the person speaking, as opposed to what is being said. Speech recognition applications include voice dialing (e.g., "Call home"), call routing (e.g., "I would like to make a collect call"), domotic appliance control and content-based spoken audio search (e.g., find a podcast where particular words were spoken), simple data entry (e.g., entering a credit card number), preparation of structured documents (e.g., a radiology report), speech-to-text processing (e.g., word processors or emails), and in aircraft cockpits (usually termed Direct Voice Input). (en)
  • El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras electrónicas. El problema que se plantea en un sistema de RAH es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido. (es)
  • Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik, bzw. der Ingenieurwissenschaften. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation. (de)
  • Puheentunnistus on joukko kieli- ja puheteknologian alaan kuuluvia hahmontunnistusmenetelmiä, joiden avulla tietokone voi tunnistaa ihmisten puhetta. Puheentunnistusmenetelmien avulla voidaan esimerkiksi valmistaa puheohjattavia laitteita tai taltioida puhetta tekstimuotoiseksi. (fi)
  • La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d'analyser un mot ou une phrase captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance vocale, ainsi que la synthèse vocale, l'identification du locuteur ou la vérification du locuteur, font partie des technologies de traitement de la parole. Ces technologies permettent notamment de réaliser des interfaces vocales c'est à dire des interfaces homme-machine (IHM) où une partie de l'interaction se fait à la voix. Parmi les nombreuses applications, on peut citer les applications de dictée vocale sur PC où la difficulté tient à la taille du vocabulaire et à la longueur des phrases, mais aussi les applications téléphoniques de type serveur vocal, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics). (fr)
  • Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale. Sistemi di riconoscimento vocale vengono utilizzati per applicazioni vocali automatizzate nel contesto delle applicazioni telefoniche, ad esempio call center automatici, per sistemi di dettatura (in inglese dictation systems), che consentono di dettare discorsi al computer, oppure per sistemi di controllo del sistema di navigazione satellitare o del telefono in auto tramite comandi vocali. I principali software di questo genere in commercio sono Dragon Naturally Speaking 9.0 della Nuance, Loquendo ASR di Telecom Italia e IBM Via Voice 10.0. Per un periodo si era affermato un terzo prodotto, Philips FreeSpeech, che dal 2000 non è più aggiornato. IBM nel 2004 ha ceduto codice e tecnologia all'avversario che è divenuto leader di settore. Via Voice è rimasto alla versione 10 Professional, non più aggiornato. Questi programmi funzionano con algoritmi adattativi di tipo statistico inferenziale, che ricostruiscono il linguaggio in base alla frequenza delle associazioni fra parole. Possiedono anche un vocabolario fonetico con le pronuncie base di numerose parole nella lingua selezionata. L'altra grande famiglia di sistemi per l'analisi del linguaggio utilizza un vocabolario costruito dai programmatori e dall'utente, non dal software, ad esempio tramite l'ontologie. Il programma di riconoscimento vocale propriamente non deve "capire", ma trascrivere quanto detto. Tuttavia, il possesso di un vocabolario non solo di singole parole, ma di loro associazioni tipiche, inserito dall'uomo o ricostruito con mezzi statistici, è di notevole aiuto a migliorare la qualità del riconoscimento. Nuance è proprietaria del marchio Dragon ed è distributore italiano anche di IBm via Voice. Negli anni ha specializzato i vocabolari inseriti nel prodotto, per settore merceologico. I programmi permettono di dettare documenti in qualunque editor di testo come Notepad, Word, openOffice o la casella di testo della propria Web Mail. Permettono anche di costruire macro vocali che comandano la freccia del mouse per riavviare il computer, aprire e chiudere file e programmi, accedere ai menu o a un dato sito Internet. L'istallazione richiede la lettura di un brano davanti al microfono, per abituare il programma a riconoscere la voce, che viene registrata e analizzata per costruire una libreria di file vocali. L'addestramento del programma rispetto alla voce del lettore riduce drasticamente gli errori legati al riconoscimento vocale. In un secondo momento, il programma chiede un elenco di documenti Word o in altri formati scritti da chi parla, per memorizzare il suo lessico. (it)
  • 音声認識(おんせいにんしき, speech recognition)は、ヒトの話す音声言語をコンピュータによって解析し、話している内容を文字データとして取り出す処理のこと。キーボードからの入力に代わる文字入力方法として注目を集めている。 音声認識に関連が深い技術として、あらかじめ記録しておいた音声パターンと比較して個人認証等をおこなう、話者認識がある。 パソコンの場合、文章を入力する用途では音声入力またはディクテーション、アプリケーションの操作は音声操作と呼ばれる。 (ja)
  • Spraakherkenning maakt het mogelijk een computer te bedienen met behulp van de menselijke stem. (nl)
  • Talegjenkjenning (engelsk: Speech Recognition) kalles prosessen å gjenkjenne menneskelig tale av en maskin. Denne teknologien gjør det mulig å styre en maskin ved hjelp av tale. Gjenkjenningen skjer vanligvis ved hjelp av et dataprogram som igjen styrer andre programmer eller utstyr koblet til datamaskinen. Mennesker med fysiske funksjonsnedsettelser, som ikke kan styre en datamaskin ved hjelp av tastatur og mus, kan ha spesiell utbytte av talegjenkjenning. (no)
  • Rozpoznawanie mowy to technologia pozwalająca komputerowi wyposażonemu w urządzenie do próbkowania dźwieku (np. karta dźwiękowa z mikrofonem) interpretować mowę ludzką, na przykład, do celów transkrypcji lub jako alternatywna metoda interakcji z komputerem. Wyróżniamy kilka rodzajów rozpoznawania mowy: rozpoznawanie pojedynczych fonemów, rozpoznawanie izolowanych słów, rozpoznawanie łączonych słów oraz rozpoznawanie mowy ciągłej. (pl)
  • Tecnologias de reconhecimento de fala permitem que computadores equipados com microfones interpretem a fala humana, por exemplo, para transcrição ou como método de comando por voz. Tais sistemas podem ser classificados por requererem ou não que o usuário treine o sistema a reconhecer seu padrões particulares de fala, por ter a habilidade de reconhecer fala contínua ou por requerer que o usuário fale pausadamente, e pelo tamanho do vocabulário que é capaz de reconhecer (pequeno, da ordem de dezenas a centenas de palavras, ou grande, com milhares de palavras). Sistemas que requerem pouco treinamento podem capturar continuamente a fala com um amplo vocabulário em um ritmo normal com uma precisão de cerca de 98% (duas palavras erradas em cem), e sistemas que não requerem treinamento podem reconhecer um número pequeno de palavras (por exemplo, os dez dígitos do sistema decimal). Tais sistemas são populares por direcionar chamadas telefônicas recebidas em grandes organizações para seus destinos. Sistemas comerciais para reconhecimento de fala têm estado disponíveis desde os anos 90. Porém, é interessante notar que apesar do aparente sucesso dessa tecnologia, poucas pessoas os usam. Parece que a maioria dos usuários de computador pode criar e editar documentos mais rapidamente com um teclado convencional, apesar do fato de que muitas pessoas são capazes de falar consideravelmente mais rápido do que podem digitar. Além disso, o uso intenso dos órgãos da fala pode resultar em sobrecarga vocal. Alguns dos problemas técnicos chaves do reconhecimento da fala são: * Diferenças entre os interlocutores são freqüentemente grandes e dificultam. Não está claro quais características da fala são independentes do falante. * A interpretação de vários fonemas, palavras e frases é sensível ao contexto. Por exemplo: os fonemas são geralmente mais curtos em palavras longas do que em palavras pequenas. As palavras têm significados diferentes em frases diferentes. Por exemplo: "Philip lies" pode ser interpretado como Philip sendo um mentiroso ou como Philip deitando-se na cama. * A entonação e o timbre da fala podem mudar completamente a interpretação de uma palavra ou frase. Por exemplo: "Vai!", "Vai?" e "Vai." podem ser claramente reconhecidos por um humano, mas não tão facilmente por um computador. * Palavras e frases podem ter várias interpretações válidas de modo que o falante deixe a escolha da correta para o ouvinte. * A linguagem escrita precisa de pontuação de acordo com regras estritas que não estão fortemente presentes na fala e são difíceis de inferir sem conhecer o significado (vírgulas, fim de frase, citações). O "entendimento" do significado das palavras ditas é pensado como um campo separado do entendimento natural da linguagem. (pt)
  • Распознавание речи — набор технологий, позволяющих управлять компьютером, используя человеческий голос. Коммерческие программы по распознаванию речи появились в начале девяностых годов. Обычно их используют люди, которые из-за травмы руки не в состоянии набирать большое количество текста. Эти программы (например, Dragon Naturally Speaking) переводят голос пользователя в текст, таким образом, разгружая его руки. Надёжность перевода у таких программ не очень высока, но с годами она постепенно улучшается. Интеллектуальные речевые решения, позволяющие автоматически синтезировать и распознавать человеческую речь, являются следующей ступенью развития интерактивных голосовых систем (IVR). Использование интерактивного телефонного приложения в настоящее время не веяние моды, а жизненная необходимость. Снижение нагрузки на операторов контакт-центров и секретарей, сокращение расходов на оплату труда и повышение производительности систем обслуживания — вот только некоторые преимущества, доказывающие целесообразность подобных решений. Прогресс, однако, не стоит на месте и в последнее время в телефонных интерактивных приложениях все чаще стали использоваться системы автоматического распознавания и синтеза речи. В этом случае общение с голосовым порталом становится более естественным, так как выбор в нем может быть осуществлен не только с помощью тонового набора, но и с помощью голосовых команд. При этом системы распознавания являются независимыми от дикторов, то есть распознают голос любого человека. (ru)
  • *För ASR hos fordon, se: Antispinn. Taligenkänning, ASR (engelska Automatic Speech Recognition), kallas processen att elektroniskt eller datatekniskt känna igen mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer. Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Det bedrivs omfattade forskning kring förståelsen av naturligt tal. Moderna taligenkänningssystem bygger oftast på statistiska metoder där tal tolkas i flera nivåer med hjälp av hypoteser och grammatiker som definierar troliga/kända kombinationer av språkelement. I mer avancerade system är dessa modeller ofta adaptiva och därmed öppna för inlärning av nya grammatikelement genom en halvautomatisk analys av vilka fraser som misslyckas att bli korrekt förstådda, följt av korrigering av de grammatiska och akustiska modellerna. Nivåer i ASR: # akustik - identifiering av fonem, dvs ljudstyrka för frekvenserkombinationer och akustiskt förlopp # ord - ihopsättning av fonem # ordföljder - urval av troligaste ordföljder jämfört med en stor databas med talat språk # grammatik - verifiering av hypotetiska ordföljder mot grammatik som gäller för det specifika domänen (till exempel en grammatik för biljettbokningar innhåller vanliga fraser och meningar som har med biljetter att göra, men det finns ingen anledning att till exempel ha med grammatik för fotbollsammanhang) # semantik - uttydning av informationsbärande element Enklare ASR förväntar sig enkla svar på frågor, till exempel Fråga: Vart vill du åka? Ange orten! Svar: Malmö Fråga: Varifrån vill du åka? ange orten! Svar: Kiruna ASR som kan hantera fritt tal kan under optimala omstämdigheter klara av komplicerade utsagor som till exempel: Fråga: Beskriv din resa! Svar: Jag vill ta tåget från Kiruna till Malmö, andra klass. Då folk inte talar grammatiskt, och ofta stakar sig så måste man kunna filtrera bort harklingar, upprepade ord, otydliga ord, ord utan betydelse, till exempel Svar: Hmmm Ja just det, vi tar tåget, ta tåget från.. från öööö Kiru.. Kiruna var det till Skåne, till Malmö, ja just det till öööö Malmö skall jag åka. (sv)
  • 与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。 语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 (zh)
p:dmozProperty
  • Computers/Speech_Technology (en)
  • Speech Technology (en)
p:hasPhotoCollection
p:wikiPageUsesTemplate
p:wikipage-de
p:wikipage-es
p:wikipage-fi
p:wikipage-fr
p:wikipage-it
p:wikipage-ja
p:wikipage-nl
p:wikipage-no
p:wikipage-pl
p:wikipage-pt
p:wikipage-ru
p:wikipage-sv
p:wikipage-zh
rdfs:comment
  • responds to questions, i.e. "Where are you?" or statements, i.e. "Hello."]]Speech recognition (also known as automatic speech recognition or computer speech recognition) converts spoken words to machine-readable input (for example, to keypresses, using the binary code for a string of character codes). (en)
  • El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras electrónicas. (es)
  • Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik, bzw. der Ingenieurwissenschaften. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation. (de)
  • Puheentunnistus on joukko kieli- ja puheteknologian alaan kuuluvia hahmontunnistusmenetelmiä, joiden avulla tietokone voi tunnistaa ihmisten puhetta. Puheentunnistusmenetelmien avulla voidaan esimerkiksi valmistaa puheohjattavia laitteita tai taltioida puhetta tekstimuotoiseksi. (fi)
  • La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d'analyser un mot ou une phrase captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance vocale, ainsi que la synthèse vocale, l'identification du locuteur ou la vérification du locuteur, font partie des technologies de traitement de la parole. (fr)
  • Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale. (it)
  • 音声認識(おんせいにんしき, speech recognition)は、ヒトの話す音声言語をコンピュータによって解析し、話している内容を文字データとして取り出す処理のこと。キーボードからの入力に代わる文字入力方法として注目を集めている。 (ja)
  • Spraakherkenning maakt het mogelijk een computer te bedienen met behulp van de menselijke stem. (nl)
  • Talegjenkjenning (engelsk: Speech Recognition) kalles prosessen å gjenkjenne menneskelig tale av en maskin. Denne teknologien gjør det mulig å styre en maskin ved hjelp av tale. Gjenkjenningen skjer vanligvis ved hjelp av et dataprogram som igjen styrer andre programmer eller utstyr koblet til datamaskinen. Mennesker med fysiske funksjonsnedsettelser, som ikke kan styre en datamaskin ved hjelp av tastatur og mus, kan ha spesiell utbytte av talegjenkjenning. (no)
  • Rozpoznawanie mowy to technologia pozwalająca komputerowi wyposażonemu w urządzenie do próbkowania dźwieku (np. karta dźwiękowa z mikrofonem) interpretować mowę ludzką, na przykład, do celów transkrypcji lub jako alternatywna metoda interakcji z komputerem. Wyróżniamy kilka rodzajów rozpoznawania mowy: rozpoznawanie pojedynczych fonemów, rozpoznawanie izolowanych słów, rozpoznawanie łączonych słów oraz rozpoznawanie mowy ciągłej. (pl)
  • Tecnologias de reconhecimento de fala permitem que computadores equipados com microfones interpretem a fala humana, por exemplo, para transcrição ou como método de comando por voz. (pt)
  • Распознавание речи — набор технологий, позволяющих управлять компьютером, используя человеческий голос. Коммерческие программы по распознаванию речи появились в начале девяностых годов. (ru)
  • *För ASR hos fordon, se: Antispinn. (sv)
  • 与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。 (zh)
rdfs:label
  • Speech recognition (en)
  • Reconocimiento del habla (es)
  • Spracherkennung (de)
  • Puheentunnistus (fi)
  • Reconnaissance vocale (fr)
  • Riconoscimento vocale (it)
  • 音声認識 (ja)
  • Spraakherkenning (nl)
  • Talegjenkjenning (no)
  • Rozpoznawanie mowy (pl)
  • Reconhecimento de fala (pt)
  • Распознавание речи (ru)
  • Taligenkänning (sv)
  • 语音识别 (zh)
skos:subject
foaf:page
dbpedia-owl:Company#products
p:genre
p:keywords
p:products
p:redirect