About: Speech recognition

Property	Value
dbo:abstract	El reconeixement automàtic de la parla (RAP) o reconeixement automàtic de veu és una part de la intel·ligència artificial que té com a objectiu permetre la comunicació parlada entre éssers humans i computadores electròniques. Un sistema de reconeixement de veu és una eina computacional, capaç de processar el senyal de veu i reconèixer la informació que porta. Les disciplines que intervenen en aquest procés són, la fisiologia, l'acústica, el processament de senyal (quantificació), la intel·ligència artificial i la ciència computacional. El principal problema que es planteja en un sistema de RAP és el de fer cooperar un conjunt d'informacions que provenen de diverses fonts de coneixement: acústica, fonètica, fonològica, lèxica, sintàctica, semàntica i pragmàtica); en presència d'ambigüitats, incerteses i errors inevitables per arribar a obtenir una interpretació acceptable del missatge acústic rebut. Es tracta d'una tecnologia que ha experimentat un major avanç en els últims anys, passant de poder reconèixer només a un parlant, dins un vocabulari limitat, fins a prototips que poden reconèixer qualsevol parlant sobre vocabularis flexibles de milers de paraules. El procés de RAP intenta aconseguir una seqüència de paraules que corresponguin a la frase en el llenguatge natural d'entrada. La frase és pronunciada de forma contínua, sense pauses entre les paraules. D'aquesta manera no es generen problemes gramaticals. Per aquest motiu, aquests sistemes són força costosos en concepte de memòria de càlcul. (ca) Rozpoznáváním řeči se rozumí automatický převod mluvené řeči do textu. Metody rozpoznávání řeči jsou citlivé na rozdíly v intonaci i výslovnosti jednotlivých mluvčí, které se snaží překonat složitými výpočetními operacemi. Proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči. Existují použitelné komerční programy. Pro angličtinu (a další jazyky) zřejmě nejpokročilejším z nich Dragon Naturally Speaking spojený s IBM ViaVoice alias "Nuance Dragon". Pro češtinu se jedná o NovaVoice a NewtonDictate. Programy využívající počítačové rozpoznávání řeči mohou sloužit pro vytváření textových dokumentů nebo pro hendikepované osoby (například hlasové ovládání počítače). (cs) التعرف على الكلام أو تمييز الكلام (ويعرف أيضا بتمييز الكلام التلقائي أو تمييز الكلام أو حاسب تمييز الكلام) وهو عبارة عن تحويل الكلمات المنطوقة إلى نص. إن مصطلح «تمييز الصوت» في بعض الأحيان يطلق على أنظمة التمييز التي يجب أن تدرب على متحدث معين، كما هو الحال بالنسبة لمعظم برامج تمييز سطح المكتب. التعرف على المتحدث يستطيع تبسيط مهمة ترجمة الكلام.تمييز الكلام يعتبر حل أوسع يشير إلى تكنولوجيا بإمكانها التعرف على الكلام بدون أن تستهدف متحدث واحد – مثل نظام الاتصال الذي يستطيع التعرف على جميع الأصوات.تطبيقات تمييز الكلام تتضمن: واجهة المستخدم الصوتية مثل الطلب الصوتي (على سبيل المثال: اتصل بالمنزل)؛ توجيه المكالمات (على سبيل المثال: أريد عمل مكالمة تليفونية على حساب المتلقي)، التحكم بتطبيق أتمتة المنزل، البحث (على سبيل المثال: أوجد البودكاست حيث الكلمات كانت منطوقة) إدخال بيانات بسيطة (على سبيل المثال: ادخل رقم البطاقة الائتمانية)، إعداد وثائق منظمة (مثل: تقرير الأشعة)، خطاب معالجة النصوص (مثل: معالج الكلمات " Word " أو رسائل البريد الإلكتروني) والمركبة الجوية (مثل: أجهزة الإدخال المباشر). (ar) Die Spracherkennung oder auch automatische Spracherkennung ist ein Verfahren und ein Teilgebiet der angewandten Informatik, der Ingenieurwissenschaften und der Computerlinguistik. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. So lassen sich beispielsweise aus Tonspuren durchsuchbare Transkripte erstellen. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation. Allerdings ähneln sich die Realisierungen dieser Verfahren. (de) Στην επιστήμη της πληροφορικής, η αναγνώριση ομιλίας αναφέρεται στην μετατροπή προφερόμενων σε κείμενο. Είναι επίσης αλλιώς γνωστή και ως "αυτόματη αναγνώριση ομιλίας", "υπολογιστική αναγνώριση ομιλίας" ή "speech-to-text" (STT), δηλαδή (μετατροπή) "από-ομιλία-σε-κείμενο". Κάποια συστήματα αναγνώρισης ομιλίας χρησιμοποιούν "αναγνώριση ομιλίας ανεξάρτητη από τον ομιλήτη", ενώ άλλα χρησιμοποιούν "εξάσκηση", όπου ένα άτομο διαβάζει κομμάτια κειμένου σε ένα σύστημα αναγνώρισης ομιλίας. Τότε, αυτού του είδους τα συστήματα αναλύουν τη φωνή ενός ομιλητή και την χρησιμοποιούν για να προσαρμόσουν την αναγνώριση της ομιλίας του συγκεκριμένου ατόμου από τον υπολογιστή, με αποτέλεσμα την πιο ακριβή καταγραφή της. Συστήματα που δεν χρησιμοποιούν εξάσκηση ονομάζονται συστήματα "ανεξάρτητα από τον ομιλητή". Οι εφαρμογές αναγνώρισης ομιλίας συμπεριλαμβάνουν τα (Voice User Interfaces) όπως η φωνητική πληκτρολόγηση (π.χ. "Κάλεσε σπίτι"), ο έλεγχος των οικιακών ηλεκτρονικών συσκευών και συστημάτων (π.χ. "Άναψε φως"), η διαδικτυακή αναζήτηση, η απλή τοποθέτηση δεδομένων, η προετοιμασία δομημένων εγγράφων (π.χ. μία αναφορά ραδιολογίας), η επεξεργασία "από-ομιλία-σε-κείμενο" και τα . Ο όρος αναγνώριση ομιλίας δεν αναφέρεται τόσο στο "ποιος" μιλάει, αλλά στο "τι" λέει. Αναγνωρίζοντας επιπλέον όμως και την ταυτότητα του ομιλητή είναι δυνατόν να διευκολυνθεί η διαδικασία της μετάφρασης της ομιλίας του σε συστήματα που έχουν προηγουμένως εξασκηθεί στην φωνή του συγκεκριμένου ατόμου ή ακόμη είναι δυνατόν να πιστοποιηθεί ή αναγνωριστεί η ταυτότητα του ομιλητή σε συστήματα ασφαλείας. (el) Parolrekonado (ankaŭ nomata 'Aŭtomata Rekonado de parolo' aŭ 'voĉrekonado') estas subfako de la komputa lingvoscienco kiu evoluigas metodojn kaj teknologiojn kiu ebligas la rekonon kaj tradukon de lingva parolo al teksto pere de komputiloj. Ĝi estas ankaŭ konata kiel aŭtomata voĉrekono, komputila parolrekonado aŭ elparolo-alteksto. Ĝi inkluzivas sciojn kaj esplorojn de la kampoj lingvistiko, komputiko kaj elektrotekniko. La Parolrekonado 'estas distingebla de la voĉo aŭ parolanto-rekono, metodo biometria por persona identigo. Tamen, la realigoj de ĉi tiuj proceduroj estas similaj. Kelkaj parolrekonaj sistemoj postulas "trejnadon" kie individua parolanto legas tekston aŭ individuajn vortojn al la sistemo. La sistemo analizas specifan voĉon de la persono kaj uzas ĝin por agordi la rekonon de la parolado de tiu persono, pliigante precizecon. Sistemoj kiuj ne uzas trejnadon estas nomitaj "parolanto-sendependaj" sistemoj. Sistemoj kiu uzas trejnadon estas nomataj "parolanto-dependaj" sistemoj. (eo) El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es una disciplina de la inteligencia artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras. El problema que se plantea en un sistema de este tipo es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido. Un sistema de reconocimiento de voz es una herramienta computacional capaz de procesar la señal de voz emitida por el ser humano y reconocer la información contenida en esta, convirtiéndola en texto o emitiendo órdenes que actúan sobre un proceso. En su desarrollo intervienen diversas disciplinas, tales como: la fisiología, la acústica, la lingüística, el procesamiento de señales, la inteligencia artificial y la ciencia de la computación. (es) Pengenalan ucapan atau pengenalan wicara—dalam istilah bahasa Inggrisnya, automatic speech recognition (ASR)—adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara. Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar sifatnya masih tergantung kepada pembicara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi ini yang sifatnya tidak tergantung pada pembicara. Alat ini sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata. Pengenalan ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua, yaitu pengenalan pembicara (identifikasi suara berdasarkan orang yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang diucapkan). (in) Speech recognition is an interdisciplinary subfield of computer science and computational linguistics that develops methodologies and technologies that enable the recognition and translation of spoken language into text by computers with the main benefit of searchability. It is also known as automatic speech recognition (ASR), computer speech recognition or speech to text (STT). It incorporates knowledge and research in the computer science, linguistics and computer engineering fields. The reverse process is speech synthesis. Some speech recognition systems require "training" (also called "enrollment") where an individual speaker reads text or isolated vocabulary into the system. The system analyzes the person's specific voice and uses it to fine-tune the recognition of that person's speech, resulting in increased accuracy. Systems that do not use training are called "speaker-independent" systems. Systems that use training are called "speaker dependent". Speech recognition applications include voice user interfaces such as voice dialing (e.g. "call home"), call routing (e.g. "I would like to make a collect call"), domotic appliance control, search key words (e.g. find a podcast where particular words were spoken), simple data entry (e.g., entering a credit card number), preparation of structured documents (e.g. a radiology report), determining speaker characteristics, speech-to-text processing (e.g., word processors or emails), and aircraft (usually termed direct voice input). The term voice recognition or speaker identification refers to identifying the speaker, rather than what they are saying. Recognizing the speaker can simplify the task of translating speech in systems that have been trained on a specific person's voice or it can be used to authenticate or verify the identity of a speaker as part of a security process. From the technology perspective, speech recognition has a long history with several waves of major innovations. Most recently, the field has benefited from advances in deep learning and big data. The advances are evidenced not only by the surge of academic papers published in the field, but more importantly by the worldwide industry adoption of a variety of deep learning methods in designing and deploying speech recognition systems. (en) La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance de la parole, ainsi que la synthèse de la parole, l'identification du locuteur ou la vérification du locuteur, font partie des techniques de traitement de la parole. Ces techniques permettent notamment de réaliser des interfaces homme-machine (IHM) où une partie de l'interaction se fait à la voix : « interfaces vocales ». Parmi les nombreuses applications, on peut citer les applications de dictée vocale sur ordinateur où la difficulté tient à la taille du vocabulaire et à la longueur des phrases, mais aussi les applications téléphoniques de type serveur vocal interactif, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics). Dans Parole et dialogue homme-machine, W. Minker et S. Bennacef expliquent que la reconnaissance automatique de la parole est un domaine complexe, car il existe une différence importante entre le langage formel, qui est compris et utilisé par les machines, et le langage naturel, que les humains utilisent. Le langage formel est structuré par des règles syntaxiques strictes et sans ambigüité. À l'inverse, dans le langage naturel, des mots ou des phrases peuvent avoir plusieurs sens selon l'intonation de l'énonciateur ou le contexte par exemple. (fr) Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale. Sistemi di riconoscimento vocale vengono utilizzati per applicazioni vocali automatizzate nel contesto delle applicazioni telefoniche, ad esempio call center automatici, per sistemi di dettatura (in inglese dictation system), che consentono di dettare discorsi al computer, oppure per sistemi di controllo del sistema di navigazione satellitare o del telefono in auto tramite comandi vocali. (it) 音声認識（おんせいにんしき、英: speech recognition）とは、人間の声などをコンピューターに認識させることであり、話し言葉を文字列に変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能を指す。自動音声認識（英: Automatic Speech Recognition; ASR）とも。 (ja) 음성 인식(Speech Recognition)이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말한다. STT(Speech-to-Text)라고도 한다. 키보드 대신 문자를 입력하는 방식으로 주목을 받고 있다. 로봇, 텔레매틱스 등 음성으로 기기제어, 정보검색이 필요한 경우에 응용된다. 대표적인 알고리즘은 HMM(Hidden Markov Model)으로서, 다양한 화자들이 발성한 음성들을 통계적으로 모델링하여 음향모델을 구성하며 말뭉치 수집을 통하여 언어모델을 구성한다. 미리 기록해 둔 음성 패턴과 비교해 개인 인증 등의 용도로 사용하기도 하는데 이를 화자 인식이라고 한다. (ko) Rozpoznawanie mowy – technologia pozwalająca komputerowi lub innemu urządzeniu interpretować mowę ludzką, na przykład do celów transkrypcji lub jako alternatywną metodę interakcji. Dla języka polskiego (stan na rok 2008) dostępne są programy rozpoznające poprawnie 5–9 na 10 wypowiedzianych słów mowy ciągłej (na współczynnik ten, oprócz jakości algorytmu, wpływają m.in. wyrazistość i zrozumiałość mowy). Wartości skuteczności systemów rozpoznawania mowy bardzo zależą od przyjętego scenariusza testu. Dlatego informacje liczbowe, wbrew intuicji, zwykle nie są dobrym odzwierciedleniem jakości takich systemów. Najskuteczniejszą metodą jest porównanie dwóch lub więcej systemów na takim samym scenariuszu testowym. Jakość systemów może jednak także zależeć od tego jak sygnał jest rejestrowany. Przykładowo wiele z systemów oferowanych dla języka polskiego działa dużo gorzej dla sygnału z sieci GSM. Ogólnie należy przyjąć, że rozpoznawanie mowy polskiej działa poprawnie tylko dla pojedynczych słów lub dla ustalonych zbiorów scenariuszy dialogów (stan na marzec 2014). Próg komercyjnej akceptowalności systemów rozpoznawania mowy zwykle przyjmuje się jako 95% poprawności rozpoznania. (pl) Spraakherkenning is een deelgebied van de informatica en computationele taalkunde waarbinnen methoden worden onderzocht en ontwikkeld die het mogelijk maken om automaten, in het bijzonder computers, het gesproken woord te laten herkennen en verwerken. Spraakherkenning moet onderscheiden worden van stemherkenning, een biometrische techniek om een bepaalde persoon aan de hand van zijn stem te kunnen identificeren. De methoden om beide te realiseren zijn echter wel nauw verwant. (nl) Распознавание речи — автоматический процесс преобразования речевого сигнала в цифровую информацию (например, текстовые данные). Обратной задачей является синтез речи. (ru) Taligenkänning, ASR (engelska Automatic Speech Recognition), kallas processen att elektroniskt eller datatekniskt tolka mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer. Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Det bedrivs omfattade forskning kring förståelsen av naturligt tal. Moderna taligenkänningssystem bygger oftast på statistiska metoder där tal tolkas i flera nivåer med hjälp av hypoteser och grammatiker som definierar troliga/kända kombinationer av språkelement. I mer avancerade system är dessa modeller ofta adaptiva och därmed öppna för inlärning av nya grammatikelement genom en halvautomatisk analys av vilka fraser som misslyckas att bli korrekt förstådda, följt av korrigering av de grammatiska och akustiska modellerna. Nivåer i ASR: 1. * akustik - identifiering av fonem, dvs. ljudstyrka för frekvenserkombinationer och akustiskt förlopp 2. * ord - ihopsättning av fonem 3. * ordföljder - urval av troligaste ordföljder jämfört med en stor databas med talat språk 4. * grammatik - verifiering av hypotetiska ordföljder mot grammatik som gäller för det specifika domänen (till exempel en grammatik för biljettbokningar innehåller vanliga fraser och meningar som har med biljetter att göra, men det finns ingen anledning att till exempel ha med grammatik för fotbollsammanhang) 5. * semantik - uttydning av informationsbärande element Enklare ASR förväntar sig enkla svar på frågor, till exempel Fråga: Vart vill du åka? Ange orten!Svar: MalmöFråga: Varifrån vill du åka? ange orten!Svar: Kiruna ASR som kan hantera fritt tal kan under optimala omständigheter klara av komplicerade utsagor som till exempel: Fråga: Beskriv din resa!Svar: Jag vill ta tåget från Kiruna till Malmö, andra klass. Då folk inte talar grammatiskt, och ofta stakar sig så måste man kunna filtrera bort harklingar, upprepade ord, otydliga ord, ord utan betydelse, till exempel Svar: Hmmm Ja just det, vi tar tåget, ta tåget från.. från öööö Kiru.. Kiruna var det till Skåne, till Malmö, ja just det till öööö Malmö skall jag åka. (sv) Reconhecimento de fala é uma área interdisciplinar originária da linguística computacional cujo objetivo é desenvolver métodos e tecnologias que permitam o reconhecimento e a transcrição de linguagem falada de maneira automática. As tecnologias de reconhecimento de fala são normalmente conhecidas pela sigla em inglês ASR de Automatic Speech Recognition (reconhecimento automático de fala), Computer Speech Recognition (reconhecimento de fala por computador) ou STT de Speech to Text (fala para texto). (pt) Розпізнава́ння мо́влення (англ. speech recognition) або мо́влення-у-те́кст (англ. speech to text (STT))— процес перетворення мовленнєвого сигналу в текстовий потік. Не варто плутати із визначенням розпізнавання мови, оскільки «розпізнати мову» безпосередньо означає лише дати відповідь на питання, до якої мови належить сегмент мовленнєвого сигналу. Часто використовується у наборі технологій, що дають змогу керувати комп'ютером, використовуючи людський голос, вводити інформацію голосом, диктувати, транскрибувати (стенографувати) фонограми. (uk) 语音识别（speech recognition）技术，也被称为自动语音识别（英語：Automatic Speech Recognition, ASR）、電腦語音識別（英語：Computer Speech Recognition）或是語音轉文本識別（英語：Speech To Text, STT），其目标是以電腦自動将人类的语音内容转换为相應的文字。与及不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合，可以构建出更加复杂的应用，例如语音到语音的翻译。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 (zh)
dbo:wikiPageExternalLink	https://www.academia.edu/4685517/SpeeG2_A_Speech-_and_Gesture-based_Interface_for_Efficient_Controller-free_Text_Entry
dbo:wikiPageID	29468 (xsd:integer)
dbo:wikiPageLength	103144 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1124851343 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Cambridge_University dbr:Canada dbr:Carnegie_Mellon_University dbr:Roberto_Pieraccini dbr:Robotics dbr:Royal_Aircraft_Establishment dbr:List_of_emerging_technologies dbr:N-gram dbr:Natural-language_understanding dbr:Natural_language_processing dbr:Cosine_transform dbr:Bell_Labs dbr:Deaf dbr:DeepMind dbr:DeepSpeech dbc:History_of_human–computer_interaction dbr:Home_automation dbr:John_R._Pierce dbr:Repetitive_Strain_Injury dbr:Resection_(surgery) dbr:DARPA_Global_autonomous_language_exploitation_program dbr:University_of_Oxford dbr:University_of_Pittsburgh dbr:University_of_Toronto dbr:University_of_Washington dbr:Université_de_Montréal dbr:Vanishing_gradient_problem dbr:Video_games dbr:Voice_user_interface dbr:VoxForge dbr:Deep_learning dbr:Dynamic_time_warping dbr:Interactive_voice_response dbr:International_Computer_Science_Institute dbr:International_Conference_on_Acoustics,_Speech,_and_Signal_Processing dbr:Electronic_Health_Record dbr:Navigation dbr:IARPA dbr:Levenshtein_distance dbr:User_interface dbr:Telephony dbr:EDiscovery dbr:Institute_for_Defense_Analysis dbr:Common_Voice dbr:Conditional_independence dbr:Massachusetts_Institute_of_Technology dbr:Saab_JAS_39_Gripen dbr:General_Dynamics_F-16_Fighting_Falcon_variants dbr:Mixture_model dbr:Speech_analytics dbr:RIPAC_(microprocessor) dbr:Timeline_of_speech_and_voice_recognition dbr:Frederick_Jelinek dbr:Frequency dbr:G-force dbr:GOOG-411 dbr:Geoffrey_Hinton dbr:GitHub dbr:Google dbr:Google_Voice dbr:Google_Voice_Search dbc:Computer_accessibility dbr:Modern_Standard_Arabic dbr:Mondegreen dbr:Mozilla dbr:Multi-factor_authentication dbr:Multimedia_information_retrieval dbr:Multimodal_interaction dbr:Mutual_information dbr:Nagoya_University dbr:Connectionist_temporal_classification dbr:Controlled_vocabulary dbc:Machine_learning_task dbr:Telematics dbr:Apple_Inc. dbr:Applications_of_artificial_intelligence dbr:Apricot_Portable dbr:Lifeline_(video_game) dbr:Lockheed_Martin_F-35_Lightning_II dbr:Artificial_neural_networks dbr:Cache_language_model dbr:Shot_(filmmaking) dbr:Siri dbr:Smartphone dbr:Standard_Chinese dbr:Stanford_University dbr:Stationary_process dbr:Computational_linguistics dbr:Computer_engineering dbr:Computer_science dbr:Email dbr:Emotion_recognition dbr:Feature_engineering dbr:Fumitada_Itakura dbr:Domotic dbr:Keyword_spotting dbr:Leonard_E._Baum dbr:Lernout_&_Hauspie dbr:Speech_synthesis dbr:Stanford_Research_Institute dbr:Markov_model dbr:Viterbi_algorithm dbr:Authentication dbr:BBN_Technologies dbr:Baidu dbr:CMU_Sphinx dbr:CSELT dbr:Tom_Clancy's_EndWar dbr:Transcription_(linguistics) dbr:U.S._Army dbr:Windows_Speech_Recognition dbr:Windows_XP dbr:Document_classification dbr:HTK_(software) dbr:Helicopter dbr:James_K._Baker dbr:Janet_M._Baker dbr:Jürgen_Schmidhuber dbr:Language_model dbr:Lattice_(order) dbr:Linear_predictive_coding dbr:Linguistics dbr:LipNet dbr:Speech_technology dbr:Speech_processing dbr:AT&T dbr:Alenia_Aermacchi_M-346_Master dbr:American_Recovery_and_Reinvestment_Act_of_2009 dbr:Amplitude dbc:User_interface_techniques dbr:Aircraft dbr:DARPA dbr:Daniel_Jurafsky dbr:Dragon_NaturallySpeaking dbr:Eurofighter_Typhoon dbr:F-16 dbr:Fighter_aircraft dbr:Formants dbr:Fourier_transform dbr:Nippon_Telegraph_and_Telephone dbr:North_American_Chapter_of_the_Association_for_Computational_Linguistics dbr:Nuance_Communications dbr:PDP-10 dbr:Digital_dictation dbr:Direct_voice_input dbr:Fluency_Voice_Technology dbr:Google_Brain dbr:Hands-free_computing dbr:Katz's_back-off_model dbr:Word_processor dbr:Spacecraft dbr:Speech_corpus dbr:Word_error_rate dbr:Court_reporting dbr:Pronunciation dbr:Recurrent_neural_network dbr:Repetitive_strain_injury dbr:Speaker_recognition dbr:Telecommunications_Relay_Service dbr:Health_care dbr:Hidden_Markov_Model dbr:Hidden_Markov_Models dbr:James_L._Flanagan dbr:Babel_program dbr:TensorFlow dbr:Finite_state_transducer dbr:Artificial_neural_network dbr:AI_effect dbr:ALPAC dbc:Automatic_identification_and_data_capture dbc:Computational_linguistics dbr:Acoustic_model dbc:Speech_recognition dbr:Aerospace dbr:Chess dbr:Alex_Graves_(computer_scientist) dbr:Kai-Fu_Lee dbr:Kaldi_(software) dbr:Kinect dbr:Language_learning dbr:Lawrence_Rabiner dbr:Learning_disability dbr:Big_data dbr:Blindness_and_education dbr:Edit_distance dbr:Hidden_Markov_model dbr:Translation dbr:Mobile_telephony dbr:Articulatory_speech_recognition dbr:Association_for_Computational_Linguistics dbr:Audio-visual_speech_recognition dbr:Audio_mining dbr:Autoencoder dbr:Automatic_Language_Translator dbr:Automotive_head_unit dbr:Mars_Polar_Lander dbr:Philadelphia dbr:Phoneme dbr:Space_exploration dbr:Speech_coding dbr:Speech_recognition_software_for_Linux dbr:Apple_Siri dbr:IBM dbr:IBM_ViaVoice dbr:IEEE dbr:Methodology dbr:Microphone dbr:National_Security_Agency dbr:Origin_of_speech dbr:Carnegie_Mellon dbr:Raj_Reddy dbr:Random-access_memory dbr:Cepstrum dbr:Sepp_Hochreiter dbr:Xuedong_Huang dbr:Markov_chain dbr:Subtitle_(captioning) dbr:Long_short-term_memory dbr:Same_language_subtitling dbr:Statistical_machine_translation dbr:Sensory,_Inc. dbr:Speech_verification dbr:Gunnar_Fant dbr:List_of_speech_recognition_software dbr:Workload dbr:Linear_Discriminant_Analysis dbr:Manfred_R._Schroeder dbr:Vocabulary dbr:Virtual_assistant_(artificial_intelligence) dbr:Heteroscedastic dbr:Speech_interface_guideline dbr:Phonetic_search_technology dbr:Second_language dbr:Interdisciplinary dbr:Speech_translation dbr:Speaker_diarisation dbr:Outline_of_artificial_intelligence dbr:VoiceXML dbr:RAF dbr:Computer_gaming dbr:Captioning dbr:Automatic_translation dbr:LIMSI dbr:Text_search dbr:Source-filter_model_of_speech_production dbr:ICASSP dbr:Bayes_risk dbr:1962_World's_Fair dbr:Fighter_pilot_helmet dbr:Finite_state_transducers dbr:Mirage_(aircraft) dbr:Audiovisual_speech_recognition dbr:Relay_services dbr:Puma_helicopter dbr:IVR dbr:Brain_AVM dbr:F-16_VISTA dbr:Cepstral_normalization dbr:Command_Success_Rate dbr:Context_dependency dbr:Delta-delta_coefficient dbr:Delta_coefficient dbr:Global_semi-tied_co_variance dbr:Heteroscedastic_linear_discriminant_analysis dbr:Interspeech dbr:Maximum_likelihood_linear_regression dbr:Maximum_likelihood_linear_transform dbr:N-best_list dbr:Re_scoring_(ASR) dbr:Real_time_factor dbr:Single_Word_Error_Rate dbr:Splicing_(speech_recognition)
dbp:wikiPageUsesTemplate	dbt:Anchor dbt:As_of dbt:Authority_control dbt:Citation_needed dbt:Cite_book dbt:Curlie dbt:Div_col dbt:Div_col_end dbt:For dbt:Main dbt:Redirect dbt:Reflist dbt:Short_description dbt:Use_dmy_dates dbt:When dbt:Natural_Language_Processing dbt:Differentiable_computing
dct:subject	dbc:History_of_human–computer_interaction dbc:Computer_accessibility dbc:Machine_learning_task dbc:User_interface_techniques dbc:Automatic_identification_and_data_capture dbc:Computational_linguistics dbc:Speech_recognition
rdf:type	owl:Thing yago:WikicatUserInterfaceTechniques yago:WikicatUserInterfaces yago:WikicatSpeeches yago:Ability105616246 yago:Abstraction100002137 yago:Act100030358 yago:Address107238694 yago:Code106355894 yago:CodingSystem106353757 yago:Cognition100023271 yago:Communication100033020 yago:Event100029378 yago:Interface106575227 yago:Know-how105616786 yago:Method105660268 yago:Program106568978 yago:PsychologicalFeature100023100 yago:Writing106359877 yago:WrittenCommunication106349220 yago:YagoPermanentlyLocatedEntity dbo:MusicGenre yago:Software106566077 yago:SpeechAct107160883 yago:Technique105665146
rdfs:comment	音声認識（おんせいにんしき、英: speech recognition）とは、人間の声などをコンピューターに認識させることであり、話し言葉を文字列に変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能を指す。自動音声認識（英: Automatic Speech Recognition; ASR）とも。 (ja) 음성 인식(Speech Recognition)이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말한다. STT(Speech-to-Text)라고도 한다. 키보드 대신 문자를 입력하는 방식으로 주목을 받고 있다. 로봇, 텔레매틱스 등 음성으로 기기제어, 정보검색이 필요한 경우에 응용된다. 대표적인 알고리즘은 HMM(Hidden Markov Model)으로서, 다양한 화자들이 발성한 음성들을 통계적으로 모델링하여 음향모델을 구성하며 말뭉치 수집을 통하여 언어모델을 구성한다. 미리 기록해 둔 음성 패턴과 비교해 개인 인증 등의 용도로 사용하기도 하는데 이를 화자 인식이라고 한다. (ko) Spraakherkenning is een deelgebied van de informatica en computationele taalkunde waarbinnen methoden worden onderzocht en ontwikkeld die het mogelijk maken om automaten, in het bijzonder computers, het gesproken woord te laten herkennen en verwerken. Spraakherkenning moet onderscheiden worden van stemherkenning, een biometrische techniek om een bepaalde persoon aan de hand van zijn stem te kunnen identificeren. De methoden om beide te realiseren zijn echter wel nauw verwant. (nl) Распознавание речи — автоматический процесс преобразования речевого сигнала в цифровую информацию (например, текстовые данные). Обратной задачей является синтез речи. (ru) Reconhecimento de fala é uma área interdisciplinar originária da linguística computacional cujo objetivo é desenvolver métodos e tecnologias que permitam o reconhecimento e a transcrição de linguagem falada de maneira automática. As tecnologias de reconhecimento de fala são normalmente conhecidas pela sigla em inglês ASR de Automatic Speech Recognition (reconhecimento automático de fala), Computer Speech Recognition (reconhecimento de fala por computador) ou STT de Speech to Text (fala para texto). (pt) Розпізнава́ння мо́влення (англ. speech recognition) або мо́влення-у-те́кст (англ. speech to text (STT))— процес перетворення мовленнєвого сигналу в текстовий потік. Не варто плутати із визначенням розпізнавання мови, оскільки «розпізнати мову» безпосередньо означає лише дати відповідь на питання, до якої мови належить сегмент мовленнєвого сигналу. Часто використовується у наборі технологій, що дають змогу керувати комп'ютером, використовуючи людський голос, вводити інформацію голосом, диктувати, транскрибувати (стенографувати) фонограми. (uk) 语音识别（speech recognition）技术，也被称为自动语音识别（英語：Automatic Speech Recognition, ASR）、電腦語音識別（英語：Computer Speech Recognition）或是語音轉文本識別（英語：Speech To Text, STT），其目标是以電腦自動将人类的语音内容转换为相應的文字。与及不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合，可以构建出更加复杂的应用，例如语音到语音的翻译。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 (zh) التعرف على الكلام أو تمييز الكلام (ويعرف أيضا بتمييز الكلام التلقائي أو تمييز الكلام أو حاسب تمييز الكلام) وهو عبارة عن تحويل الكلمات المنطوقة إلى نص. إن مصطلح «تمييز الصوت» في بعض الأحيان يطلق على أنظمة التمييز التي يجب أن تدرب على متحدث معين، كما هو الحال بالنسبة لمعظم برامج تمييز سطح المكتب. التعرف على المتحدث يستطيع تبسيط مهمة ترجمة الكلام.تمييز الكلام يعتبر حل أوسع يشير إلى تكنولوجيا بإمكانها التعرف على الكلام بدون أن تستهدف متحدث واحد – مثل نظام الاتصال الذي يستطيع التعرف على جميع الأصوات.تطبيقات تمييز الكلام تتضمن: واجهة المستخدم الصوتية مثل الطلب الصوتي (على سبيل المثال: اتصل بالمنزل)؛ توجيه المكالمات (على سبيل المثال: أريد عمل مكالمة تليفونية على حساب المتلقي)، التحكم بتطبيق أتمتة المنزل، البحث (على سبيل المثال: أوجد البودكاست حيث الكلمات كانت منطوقة) إدخال بيانات بسيطة (على سبيل (ar) El reconeixement automàtic de la parla (RAP) o reconeixement automàtic de veu és una part de la intel·ligència artificial que té com a objectiu permetre la comunicació parlada entre éssers humans i computadores electròniques. Un sistema de reconeixement de veu és una eina computacional, capaç de processar el senyal de veu i reconèixer la informació que porta. Les disciplines que intervenen en aquest procés són, la fisiologia, l'acústica, el processament de senyal (quantificació), la intel·ligència artificial i la ciència computacional. (ca) Rozpoznáváním řeči se rozumí automatický převod mluvené řeči do textu. Metody rozpoznávání řeči jsou citlivé na rozdíly v intonaci i výslovnosti jednotlivých mluvčí, které se snaží překonat složitými výpočetními operacemi. Proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči. Existují použitelné komerční programy. Pro angličtinu (a další jazyky) zřejmě nejpokročilejším z nich Dragon Naturally Speaking spojený s IBM ViaVoice alias "Nuance Dragon". Pro češtinu se jedná o NovaVoice a NewtonDictate. (cs) Στην επιστήμη της πληροφορικής, η αναγνώριση ομιλίας αναφέρεται στην μετατροπή προφερόμενων σε κείμενο. Είναι επίσης αλλιώς γνωστή και ως "αυτόματη αναγνώριση ομιλίας", "υπολογιστική αναγνώριση ομιλίας" ή "speech-to-text" (STT), δηλαδή (μετατροπή) "από-ομιλία-σε-κείμενο". (el) Die Spracherkennung oder auch automatische Spracherkennung ist ein Verfahren und ein Teilgebiet der angewandten Informatik, der Ingenieurwissenschaften und der Computerlinguistik. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. So lassen sich beispielsweise aus Tonspuren durchsuchbare Transkripte erstellen. (de) Parolrekonado (ankaŭ nomata 'Aŭtomata Rekonado de parolo' aŭ 'voĉrekonado') estas subfako de la komputa lingvoscienco kiu evoluigas metodojn kaj teknologiojn kiu ebligas la rekonon kaj tradukon de lingva parolo al teksto pere de komputiloj. Ĝi estas ankaŭ konata kiel aŭtomata voĉrekono, komputila parolrekonado aŭ elparolo-alteksto. Ĝi inkluzivas sciojn kaj esplorojn de la kampoj lingvistiko, komputiko kaj elektrotekniko. La Parolrekonado 'estas distingebla de la voĉo aŭ parolanto-rekono, metodo biometria por persona identigo. Tamen, la realigoj de ĉi tiuj proceduroj estas similaj. (eo) El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es una disciplina de la inteligencia artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras. El problema que se plantea en un sistema de este tipo es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido. (es) Pengenalan ucapan atau pengenalan wicara—dalam istilah bahasa Inggrisnya, automatic speech recognition (ASR)—adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perang (in) Speech recognition is an interdisciplinary subfield of computer science and computational linguistics that develops methodologies and technologies that enable the recognition and translation of spoken language into text by computers with the main benefit of searchability. It is also known as automatic speech recognition (ASR), computer speech recognition or speech to text (STT). It incorporates knowledge and research in the computer science, linguistics and computer engineering fields. The reverse process is speech synthesis. (en) Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale. (it) La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. (fr) Rozpoznawanie mowy – technologia pozwalająca komputerowi lub innemu urządzeniu interpretować mowę ludzką, na przykład do celów transkrypcji lub jako alternatywną metodę interakcji. Dla języka polskiego (stan na rok 2008) dostępne są programy rozpoznające poprawnie 5–9 na 10 wypowiedzianych słów mowy ciągłej (na współczynnik ten, oprócz jakości algorytmu, wpływają m.in. wyrazistość i zrozumiałość mowy). Wartości skuteczności systemów rozpoznawania mowy bardzo zależą od przyjętego scenariusza testu. Dlatego informacje liczbowe, wbrew intuicji, zwykle nie są dobrym odzwierciedleniem jakości takich systemów. Najskuteczniejszą metodą jest porównanie dwóch lub więcej systemów na takim samym scenariuszu testowym. Jakość systemów może jednak także zależeć od tego jak sygnał jest rejestrowany. Przy (pl) Taligenkänning, ASR (engelska Automatic Speech Recognition), kallas processen att elektroniskt eller datatekniskt tolka mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer. Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Nivåer i ASR: Enklare ASR förväntar sig enkla svar på frågor, till exempel Fråga: Vart vill du åka? Ange orten!Svar: MalmöFråga: Varifrån vill du åka? ange orten!Svar: Kiruna (sv)
rdfs:label	Speech recognition (en) تعرف على الكلام (ar) Reconeixement de la parla (ca) Rozpoznávání řeči (cs) Spracherkennung (de) Αναγνώριση ομιλίας (el) Parolrekonado (eo) Reconocimiento del habla (es) Hizketa-ezagutze (eu) Pengenalan ucapan (in) Riconoscimento vocale (it) Reconnaissance automatique de la parole (fr) 音声認識 (ja) 음성 인식 (ko) Spraakherkenning (nl) Rozpoznawanie mowy (pl) Reconhecimento de fala (pt) Распознавание речи (ru) Taligenkänning (sv) 语音识别 (zh) Розпізнавання мовлення (uk)
owl:sameAs	freebase:Speech recognition http://api.nytimes.com/svc/semantic/v2/concept/name/nytd_des/Voice%20Recognition%20Systems yago-res:Speech recognition wikidata:Speech recognition dbpedia-ar:Speech recognition dbpedia-be:Speech recognition http://bn.dbpedia.org/resource/কন্ঠ_সনাক্তকরণ dbpedia-ca:Speech recognition dbpedia-cs:Speech recognition dbpedia-da:Speech recognition dbpedia-de:Speech recognition dbpedia-el:Speech recognition dbpedia-eo:Speech recognition dbpedia-es:Speech recognition dbpedia-et:Speech recognition dbpedia-eu:Speech recognition dbpedia-fa:Speech recognition dbpedia-fi:Speech recognition dbpedia-fr:Speech recognition dbpedia-gl:Speech recognition dbpedia-he:Speech recognition http://hi.dbpedia.org/resource/श्रुतलेखन_सॉफ्टवेयर dbpedia-hr:Speech recognition http://hy.dbpedia.org/resource/Խոսքի_Ճանաչում dbpedia-id:Speech recognition dbpedia-is:Speech recognition dbpedia-it:Speech recognition dbpedia-ja:Speech recognition dbpedia-ko:Speech recognition dbpedia-mk:Speech recognition dbpedia-ms:Speech recognition dbpedia-nl:Speech recognition dbpedia-no:Speech recognition dbpedia-pl:Speech recognition dbpedia-pt:Speech recognition dbpedia-ro:Speech recognition dbpedia-ru:Speech recognition dbpedia-simple:Speech recognition dbpedia-sk:Speech recognition dbpedia-sr:Speech recognition dbpedia-sv:Speech recognition http://ta.dbpedia.org/resource/பேச்சுணரி dbpedia-th:Speech recognition dbpedia-tr:Speech recognition dbpedia-uk:Speech recognition http://ur.dbpedia.org/resource/کلام_شناسی dbpedia-vi:Speech recognition dbpedia-zh:Speech recognition https://global.dbpedia.org/id/pbBT
prov:wasDerivedFrom	wikipedia-en:Speech_recognition?oldid=1124851343&ns=0
foaf:isPrimaryTopicOf	wikipedia-en:Speech_recognition
is dbo:academicDiscipline of	dbr:Roberto_Pieraccini dbr:James_K._Baker dbr:Janet_M._Baker
is dbo:genre of	dbr:Julius_(software) dbr:Windows_Speech_Recognition dbr:Dragon_NaturallySpeaking dbr:Tazti dbr:Kaldi_(software) dbr:Swype dbr:Speech_Technology_(magazine) dbr:IBM_ViaVoice dbr:WordQ+SpeakQ
is dbo:industry of	dbr:MacSpeech dbr:Ectaco dbr:Sensory,_Inc. dbr:Speechmatics
is dbo:knownFor of	dbr:Ami_Moyal dbr:David_H._Shepard dbr:Daniel_Povey
is dbo:product of	dbr:Loquendo dbr:TuVox dbr:Nuance_Communications dbr:AudioCodes dbr:Yap_(company) dbr:SpeechFX dbr:LumenVox
is dbo:regionServed of	dbr:IFlytek
is dbo:service of	dbr:Xiao-i dbr:Vlingo
is dbo:wikiPageDisambiguates of	dbr:Recognition
is dbo:wikiPageRedirects of	dbr:DeepSpeech dbr:History_of_speech_recognition dbr:History_of_speech_recognition_software dbr:Voice_dictation dbr:Automatic_speech_recognition dbr:End-to-end_automatic_speech_recognition dbr:Voice_command dbr:Dictation_software dbr:Applications_of_speech_recognition dbr:Phoneme_recognition dbr:Speech_Recognition dbr:Military_applications_of_speech_recognition dbr:Speech_to_text dbr:Computer_speech_recognition dbr:Speech_recognition_software_in_healthcare dbr:Speech_understanding dbr:Voice_Tag dbr:Automated_speech_recognition dbr:Automatic_Speech_Recognition dbr:Automatic_speech_recognizer dbr:Voice-to-text dbr:Voice_Command dbr:Voice_Recognition_Command_System dbr:Voice_dialing dbr:Voice_recognition_software dbr:Voice_to_text dbr:Voice_typing dbr:Speach_to_text dbr:Speech-recognition dbr:Speech-to-Text dbr:Speech-to-text dbr:SpeechTEK dbr:Speech_recognition_software dbr:Speech_recognition_technology dbr:Speech_recognizer dbr:Speech_to_Text dbr:Spoken_word_recognition
is dbo:wikiPageWikiLink of	dbr:Callware dbr:Carnegie_Mellon_University dbr:Ami_Moyal dbr:Bayesian_programming dbr:Psion_(company) dbr:QuickFuse dbr:Robert_Mercer dbr:Roberto_Pieraccini dbr:Samsung_Galaxy_Home dbr:Samsung_Galaxy_S_III dbr:Sanbot_(robot) dbr:Sandra_Hutchins dbr:Enon_(robot) dbr:Enrico_Bocchieri dbr:Ensemble_learning dbr:Entropy_estimation dbr:List_of_artificial_intelligence_projects dbr:List_of_computer_scientists dbr:List_of_crowdsourcing_projects dbr:List_of_datasets_for_machine-learning_research dbr:List_of_emerging_technologies dbr:List_of_free_and_open-source_software_packages dbr:Menu_(computing) dbr:Mike_Phillips_(speech_recognition) dbr:Modality_(human–computer_interaction) dbr:N-gram dbr:Nao_(robot) dbr:Natural-language_understanding dbr:Natural_language_processing dbr:Neural_machine_translation dbr:Neural_network dbr:M-theory_(learning_framework) dbr:MacSpeech_Dictate dbr:Meinü_robot dbr:Omnibot dbr:Time_series dbr:Voice_Elements dbr:Progress_in_artificial_intelligence dbr:TX-0 dbr:2081:_A_Hopeful_View_of_the_Human_Future dbr:Bayesian_network dbr:Beckman_Institute_for_Advanced_Science_and_Technology dbr:Bishnu_S._Atal dbr:Braina dbr:Brendan_Frey dbr:David_Gerrold dbr:David_H._Shepard dbr:Deborah_Washington_Brown dbr:DeepSpeech dbr:Delores_M._Etter dbr:Algorithmic_Justice_League dbr:Allison_Koenecke dbr:Andrew_Sears dbr:András_Kornai dbr:Apple_Advanced_Technology_Group dbr:Apptek dbr:Architectural_pattern dbr:History_of_artificial_intelligence dbr:History_of_speech_recognition dbr:History_of_speech_recognition_software dbr:HomePod dbr:HomePod_Mini dbr:How_to_Create_a_Mind dbr:Hymnen dbr:Joseph_Keshet dbr:Journal_of_the_International_Phonetic_Association dbr:Joy_Buolamwini dbr:Julie_Payette dbr:Julius_(software) dbr:List_of_Java_APIs dbr:List_of_Xbox_360_accessories dbr:List_of_Xbox_One_accessories dbr:List_of_important_publications_in_computer_science dbr:List_of_mergers_and_acquisitions_by_Apple dbr:List_of_repetitive_strain_injury_software dbr:Peiker_Acustic dbr:Peter_D._Welch dbr:Regulus_Grammar_Compiler dbr:Rob_A._Rutenbar dbr:Rob_Strickland dbr:Customer_intelligence dbr:DARPA_Global_autonomous_language_exploitation_program dbr:Unisound dbr:Universal_translator dbr:Vendor_Neutral_Archive dbr:Versant dbr:Voice_dictation dbr:Voice_user_interface dbr:Voice_writing dbr:VoxForge dbr:Deaths_in_September_2010 dbr:Deep_learning dbr:Desert_Research_and_Technology_Studies dbr:Dynamic_Bayesian_network dbr:Dynamic_time_warping dbr:ETI_Telecom dbr:Index_of_cognitive_science_articles dbr:Index_of_linguistics_articles dbr:Information_engineering_(field) dbr:Input_device dbr:Inputlog dbr:Institute_of_Acoustics,_Chinese_Academy_of_Sciences dbr:Intelligent_computer-assisted_language_learning dbr:Interactive_voice_response dbr:International_Conference_on_Computatio...stics_and_Intelligent_Text_Processing dbr:Jan_Hajič dbr:Kyiv_Laboratory_for_Artificial_Intelligence dbr:Automatic_speech_recognition dbr:Structured_prediction dbr:PowerPC_5000 dbr:Prescriptive_analytics dbr:Sparse_distributed_memory dbr:The_Age_of_Spiritual_Machines dbr:Psychoacoustics dbr:Sakura_HyperMedia_Desktop dbr:Smart_TV dbr:Nortel_Speech_Server dbr:Telephony dbr:Zetes_(company) dbr:Robot_Interaction_Language dbr:Timeline_of_portable_computers dbr:1-800-FREE-411 dbr:Comparison_of_web_browsers dbr:Computer dbr:Computer_accessibility dbr:Computer_keyboard dbr:Control_Panel_(Windows) dbr:Cowon dbr:Mehryar_Mohri dbr:SRI_International dbr:Erroneous_reporting_on_the_2008_Mumbai_attacks dbr:Optical_character_recognition dbr:Orthographic_transcription dbr:Voxeo dbr:Star_Trek:_Klingon dbr:Vehicle_audio dbr:Speech_Processing_Solutions dbr:Speech_analytics dbr:Speech_disfluency dbr:Shrutlekhan-Rajbhasha dbr:Science_and_technology_in_Iran dbr:Quad_digital_audio_processor dbr:RIPAC_(microprocessor) dbr:Subvocal_recognition dbr:Toni_Dove dbr:Timeline_of_Amazon_Web_Services dbr:Timeline_of_speech_and_voice_recognition dbr:Chu_Bong-Foo dbr:Alex_Waibel dbr:Electrical_engineering dbr:Emil_Michael dbr:End-to-end_automatic_speech_recognition dbr:Frederick_Jelinek dbr:Friends_(smart_speaker) dbr:Functional_data_analysis dbr:GNOME dbr:GOOG-411 dbr:Garry_Kasparov dbr:Glossary_of_artificial_intelligence dbr:Glossary_of_computer_science dbr:Glossary_of_engineering:_M–Z dbr:Google_Assistant dbr:Google_Cloud_Platform dbr:Google_Meet dbr:Google_Nest_(smart_speakers) dbr:Google_Translate dbr:Google_Voice dbr:Mitra_Robot dbr:Mitre_Corporation dbr:Mobvoi dbr:Mondegreen dbr:Moses_(machine_translation) dbr:Motorola_E815 dbr:Multimedia_information_retrieval dbr:Multimodal_interaction dbr:Mundolingua dbr:Concept_processing dbr:Confusion_network dbr:Connected_toys dbr:Constructed_language dbr:Construction_field_computing dbr:Consumer_adoption_of_technological_innovations dbr:Contacts_(Apple) dbr:Conversational_commerce dbr:Credential dbr:Crossing-based_interface dbr:The_Power_(Snap!_song) dbr:Thomas_Huang dbr:Ergonomic_keyboard dbr:LENA_Foundation dbr:Mars_suit dbr:Martha_Mason_(writer) dbr:Mercedes-Benz_F200 dbr:Open_plan dbr:Optical_head-mounted_display dbr:2010s_in_science_and_technology dbr:Andrew_Tridgell dbr:Andrew_Viterbi dbr:Android_(robot) dbr:Android_Auto dbr:Apple_Open_Collaboration_Environment dbr:Applications_of_artificial_intelligence dbr:Baum–Welch_algorithm dbr:Benoit_&_Sergio dbr:Bernard_Etxepare dbr:Lenovo_Smart_Assistant dbr:Lexus_IS_(XE20) dbr:Lexus_LS dbr:Lexus_RX dbr:Li_Sheng_(computer_scientist) dbr:Lifeline_(video_game) dbr:Lingua_Libre dbr:Linguatec dbr:Lips_(video_game) dbr:Live_Transcribe dbr:Loquendo dbr:MOSFET_applications dbr:MacSpeech dbr:Machine_learning dbr:Magneti_Marelli dbr:Cache_language_model dbr:Call_centre dbr:Call_management dbr:Chin-Hui_Lee dbr:Chinese_input_methods_for_computers dbr:Signal_processing dbr:Siri dbr:SmartAction dbr:Smartphone dbr:Starship_Commander:_Arcade dbr:Stephanie_Seneff dbr:Stephen_E._Levinson dbr:Subtitle_Composer dbr:Subtitles dbr:Closed_captioning dbr:Companion_robot dbr:Comparison_of_user_features_of_messaging_platforms dbr:Computational_auditory_scene_analysis dbr:Computational_linguistics dbr:Computer-assisted_language_learning dbr:Computer_audition dbr:Computer_engineering dbr:Computer_engineering_compendium dbr:Computer_performance_by_orders_of_magnitude dbr:Computer_science dbr:Zero_ASIC dbr:Zoom_Video_Communications dbr:Emotion_recognition dbr:Feature_(machine_learning) dbr:Features_new_to_Windows_7 dbr:Features_new_to_Windows_XP dbr:Hotel_Technology_Next_Generation dbr:How_William_Shatner_Changed_the_World dbr:Keyboard_technology dbr:Keystroke_logging dbr:Leonard_E._Baum dbr:Lernout_&_Hauspie dbr:Robotic_process_automation dbr:Semantic_audio dbr:Pattern_recognition dbr:Pronunciation_Lexicon_Specification dbr:Machine_learning_in_video_games dbr:Machine_translation_of_sign_languages dbr:Speech dbr:Speech_synthesis dbr:Texas_Instruments_Professional_Computer dbr:Text,_Speech_and_Dialogue dbr:Text_Services_Framework dbr:Markov_model dbr:Mass_surveillance dbr:Mazin_Gilbert dbr:McGill_University_Faculty_of_Engineering dbr:MedSLT dbr:Microphone_array dbr:Microsoft_Speech_API dbr:Microsoft_Voice_Command dbr:Viterbi_algorithm dbr:Australian_English_phonology dbr:Automatic_content_extraction dbr:BINA48 dbr:BMW_6_Series_(E63) dbr:Backpropagation dbr:800-The-Info dbr:Bugis dbr:CAPTCHA dbr:CMU_Pronouncing_Dictionary dbr:CMU_Sphinx dbr:CSELT dbr:Actroid dbr:CereProc dbr:Agfa-Gevaert dbr:Tmall_Genie dbr:Toki_Pona dbr:Tom_Clancy's_EndWar dbr:Toyota_Prius_(XW30) dbr:Transcription_(linguistics) dbr:Trump–Ukraine_scandal dbr:TuVox dbr:Tunisian_Arabic dbr:Typing
is dbp:category of	dbr:Speech_Technology_(magazine)
is dbp:fields of	dbr:Roberto_Pieraccini dbr:James_K._Baker dbr:Janet_M._Baker
is dbp:genre of	dbr:Julius_(software) dbr:Windows_Speech_Recognition dbr:Dragon_NaturallySpeaking dbr:Tazti dbr:Kaldi_(software) dbr:Swype dbr:IBM_ViaVoice dbr:WordQ+SpeakQ
is dbp:industry of	dbr:Ectaco dbr:Sensory,_Inc. dbr:Speechmatics
is dbp:input of	dbr:Friends_(smart_speaker) dbr:Lenovo_Smart_Assistant dbr:Tmall_Genie dbr:Wave_(smart_speaker) dbr:Amazon_Echo dbr:Amazon_Echo_Show dbr:Meta_Portal
is dbp:knownFor of	dbr:Daniel_Povey
is dbp:products of	dbr:TuVox dbr:AudioCodes dbr:Yap_(company) dbr:SpeechFX dbr:LumenVox
is dbp:services of	dbr:Xiao-i dbr:Vlingo
is rdfs:seeAlso of	dbr:Computer-supported_collaboration
is foaf:primaryTopic of	wikipedia-en:Speech_recognition