Speech recognition is an interdisciplinary subfield of computer science and computational linguistics that develops methodologies and technologies that enable the recognition and translation of spoken language into text by computers. It is also known as automatic speech recognition (ASR), computer speech recognition or speech to text (STT). It incorporates knowledge and research in the computer science, linguistics and computer engineering fields.

Property Value
dbo:abstract
  • التعرف على الكلام أو تمييز الكلام ( ويعرف أيضا بتمييز الكلام التلقائي أو تمييز الكلام أو حاسب تمييز الكلام) وهو عبارة عن تحويل الكلمات المنطوقة إلى نص. إن مصطلح " تمييز الصوت" في بعض الأحيان يطلق على أنظمة التمييز التي يجب أن تدرب على متحدث معين، كما هو الحال بالنسبة لمعظم برامج تمييز سطح المكتب. التعرف على المتحدث يستطيع تبسيط مهمة ترجمة الكلام.تمييز الكلام يعتبر حل أوسع يشير إلى تكنولوجيا بإمكانها التعرف على الكلام بدون أن تستهدف متحدث واحد – مثل نظام الاتصال الذي يستطيع التعرف على جميع الأصوات.تطبيقات تمييز الكلام تتضمن: واجهة المستخدم الصوتية مثل الطلب الصوتي ( على سبيل المثال: اتصل بالمنزل )؛ توجيه المكالمات ( على سبيل المثال: أريد عمل مكالمة تليفونية على حساب المتلقي )، التحكم بتطبيق أتمتة المنزل، البحث ( على سبيل المثال: أوجد البودكاست حيث الكلمات كانت منطوقة) إدخال بيانات بسيطة ( على سبيل المثال: ادخل رقم البطاقة الائتمانية )، إعداد وثائق منظمة ( مثل: تقرير الأشعة)، خطاب معالجة النصوص ( مثل: معالج الكلمات " Word " أو رسائل البريد الالكتروني ) والمركبة الجوية (مثل: أجهزة الإدخال المباشر). (ar)
  • El reconeixement automàtic de la parla (RAP) o reconeixement automàtic de veu és una part de la intel·ligència artificial que té com a objectiu permetre la comunicació parlada entre éssers humans i computadores electròniques. Un sistema de reconeixement de veu és una eina computacional, capaç de processar el senyal de veu i reconèixer la informació que porta. Les disciplines que intervenen en aquest procés són, la fisiologia, l'acústica, el processament de senyal (quantificació), la intel·ligència artificial i la ciència computacional. El principal problema que es planteja en un sistema de RAP és el de fer cooperar un conjunt d'informacions que provenen de diverses fonts de coneixement: acústica, fonètica, fonològica, lèxica, sintàctica, semàntica i pragmàtica); en presència d'ambigüitats, incerteses i errors inevitables per arribar a obtenir una interpretació acceptable del missatge acústic rebut.Es tracta d'una tecnologia que ha experimentat un major avanç en els últims anys, passant de poder reconèixer només a un parlant, dins un vocabulari limitat, fins a prototips que poden reconèixer qualsevol parlant sobre vocabularis flexibles de milers de paraules. El procés de RAP intenta aconseguir una seqüència de paraules que corresponguin a la frase en el llenguatge natural d'entrada. La frase és pronunciada de forma contínua, sense pauses entre les paraules. D'aquesta manera no es generen problemes gramaticals. Per aquest motiu, aquests sistemes són força costosos en concepte de memòria de càlcul. (ca)
  • Rozpoznáváním řeči se rozumí automatický převod mluvené řeči do textu. Metody rozpoznávání řeči jsou citlivé na rozdíly v intonaci i výslovnosti jednotlivých mluvčí, které se snaží překonat složitými výpočetními operacemi. Proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči. Existují použitelné komerční programy. Pro angličtinu (a další jazyky) zřejmě nejpokročilejším z nich Dragon Naturally Speaking spojený s IBM ViaVoice alias "Nuance Dragon". Pro češtinu se jedná o NovaVoice a NewtonDictate. Programy využívající počítačové rozpoznávání řeči mohou sloužit pro vytváření textových dokumentů nebo pro hendikepované osoby (například hlasové ovládání počítače). (cs)
  • Στην επιστήμη της πληροφορικής, η αναγνώριση ομιλίας αναφέρεται στην μετάφραση προφερόμενων σε κείμενο. Είναι επίσης αλλιώς γνωστή και ως "αυτόματη αναγνώριση ομιλίας", "υπολογιστική αναγνώριση ομιλίας" ή "speech-to-text" (STT), δηλαδή (μετατροπή) "από-ομιλία-σε-κείμενο". Κάποια συστήματα αναγνώρισης ομιλίας χρησιμοποιούν "αναγνώριση ομιλίας ανεξάρτητη από τον ομιλήτη", ενώ άλλα χρησιμοποιούν "εξάσκηση", όπου ένα άτομο διαβάζει κομμάτια κειμένου σε ένα σύστημα αναγνώρισης ομιλίας. Τότε, αυτού του είδους τα συστήματα αναλύουν τη φωνή ενός ομιλητή και την χρησιμοποιούν για να προσαρμόσουν την αναγνώριση της ομιλίας του συγκεκριμένου ατόμου από τον υπολογιστή, με αποτέλεσμα την πιο ακριβή καταγραφή της. Συστήματα που δεν χρησιμοποιούν εξάσκηση ονομάζονται συστήματα "ανεξάρτητα από τον ομιλητή". Οι εφαρμογές αναγνώρισης ομιλίας συμπεριλαμβάνουν τα (Voice User Interfaces) όπως η φωνητική πληκτρολόγηση (π.χ. "Κάλεσε σπίτι"), ο έλεγχος των οικιακών ηλεκτρονικών συσκευών και συστημάτων (π.χ. "Άναψε φως"), η διαδικτυακή αναζήτηση, η απλή τοποθέτηση δεδομένων, η προετοιμασία δομημένων εγγράφων (π.χ. μία αναφορά ραδιολογίας), η επεξεργασία "από-ομιλία-σε-κείμενο" και τα . Ο όρος αναγνώριση ομιλίας δεν αναφέρεται τόσο στο "ποιος" μιλάει, αλλά στο "τι" λέει. Αναγνωρίζοντας επιπλέον όμως και την ταυτότητα του ομιλητή είναι δυνατόν να διευκολυνθεί η διαδικασία της μετάφρασης της ομιλίας του σε συστήματα που έχουν προηγουμένως εξασκηθεί στην φωνή του συγκεκριμένου ατόμου ή ακόμη είναι δυνατόν να πιστοποιηθεί ή αναγνωριστεί η ταυτότητα του ομιλητή σε συστήματα ασφαλείας. (el)
  • Speech recognition is an interdisciplinary subfield of computer science and computational linguistics that develops methodologies and technologies that enable the recognition and translation of spoken language into text by computers. It is also known as automatic speech recognition (ASR), computer speech recognition or speech to text (STT). It incorporates knowledge and research in the computer science, linguistics and computer engineering fields. Some speech recognition systems require "training" (also called "enrollment") where an individual speaker reads text or isolated vocabulary into the system. The system analyzes the person's specific voice and uses it to fine-tune the recognition of that person's speech, resulting in increased accuracy. Systems that do not use training are called "speaker independent" systems. Systems that use training are called "speaker dependent". Speech recognition applications include voice user interfaces such as voice dialing (e.g. "call home"), call routing (e.g. "I would like to make a collect call"), domotic appliance control, search key words (e.g. find a podcast where particular words were spoken), simple data entry (e.g., entering a credit card number), preparation of structured documents (e.g. a radiology report), determining speaker characteristics, speech-to-text processing (e.g., word processors or emails), and aircraft (usually termed direct voice input). The term voice recognition or speaker identification refers to identifying the speaker, rather than what they are saying. Recognizing the speaker can simplify the task of translating speech in systems that have been trained on a specific person's voice or it can be used to authenticate or verify the identity of a speaker as part of a security process. From the technology perspective, speech recognition has a long history with several waves of major innovations. Most recently, the field has benefited from advances in deep learning and big data. The advances are evidenced not only by the surge of academic papers published in the field, but more importantly by the worldwide industry adoption of a variety of deep learning methods in designing and deploying speech recognition systems. (en)
  • Parolrekonado (ankaŭ nomata 'Aŭtomata Rekonado de parolo' aŭ 'voĉrekonado') estas subfako de la komputa lingvoscienco kiu evoluigas metodojn kaj teknologiojn kiu ebligas la rekonon kaj tradukon de lingva parolo al teksto pere de komputiloj. Ĝi estas ankaŭ konata kiel aŭtomata voĉrekono, komputila parolrekonado aŭ elparolo-alteksto. Ĝi inkluzivas sciojn kaj esplorojn de la kampoj lingvistiko, komputiko kaj elektrotekniko. La Parolrekonado 'estas distingebla de la voĉo aŭ parolanto-rekono, metodo biometria por persona identigo. Tamen, la realigoj de ĉi tiuj proceduroj estas similaj. Kelkaj parolrekonaj sistemoj postulas "trejnadon" kie individua parolanto legas tekston aŭ individuajn vortojn al la sistemo. La sistemo analizas specifan voĉon de la persono kaj uzas ĝin por agordi la rekonon de la parolado de tiu persono, pliigante precizecon. Sistemoj kiuj ne uzas trejnadon estas nomitaj "parolanto-sendependaj" sistemoj. Sistemoj kiu uzas trejnadon estas vokitaj "parolanto-dependaj" sistemoj. (eo)
  • Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik, der Ingenieurwissenschaften und der Computerlinguistik. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation. Allerdings ähneln sich die Realisierungen dieser Verfahren. (de)
  • Hizketa-ezagutzea hizketa testu bihurtzeko teknologia da. Hizketaren soinua ordenagailuarengandik onda analogikoetan hartuta izaten da, honek analizatuak eta aztertuak izaten dira, soinuaren unitateak identifikatzeko, hau da hitzak eratzen dituzten fonemak. Produkzioa ona eta kalitatezkoa izateko,lan handia suposatzen du zeren modelo ezberdin ugari batu behar dira eta batze honek jarraitua izan behar da. Ordenagailuetan erabiltzeko hizkuntza medio arrunta izango bada egunero badaude arazo garrantzitsuak gainditu behar direnak. Lehenengoa da, nola desberdinduko du ordenagailuak hizkuntza kontinua edo hiztunak egindako hizkuntza banatua eta hutsunez betetakoa. Bigarren arazoa, nola desberdindu hiztun ezberdinak, hau da, sistemak ahots desberdinak identifikatzeko prestatzearen beharra. Hirugarren arazo larria da inguruan dagoen zaratak erraz zaildu ahal duela ahotsaren identifikazioa. Hizkuntza naturalarekin diharduten teknologiak hiru atal nagusitan sailkatzen dira: hizketa testu bihurtzeko teknologiak edo hizketa-ezagutze automatikoa (ASR, Automatic Speech Recognition), testua prozesatzeko teknologiak, eta edo TTS (text-to-speech). ASR eta TTS dira hizketa-teknologien muina, testua prozesatzeko teknologiei datu-sarrera eta -irteera mintzatua ematen baitiete (ikus 1. irudia). ASR eta TTS teknologiez gainera, makinak interpretatze-, ulertze- eta elkarrizketa-osagaiak ere behar ditu erabiltzailearekin interakzio bat sortu ahal izateko; hortaz, ezaguera edo jakintza beharrezko ditu makinak. Hiru teknologiak uztartzen dituen puntako aplikazio bat ahots-ahots itzulpena da (speech-to-speech translation). Halako sistema bat garatzeko, ASR eta TTS moduluez gainera, testuaren itzulpen automatikoa (AMT, Automatic Machine Translation) egiteko modulua baliatzen du makinak, eta hizkuntza batez esandako hitz segida bat ezagutu, automatikoki itzuli eta atzera ahots bihurtzea da haren azken helburua. Hizketa-ezagutzea ahoskatutako hitzak makinak irakurtzeko gai diren sarreretan bihurtzen dituzte. "Ahots ezagutza" terminoa erabiltzen da batzuetan hizketa-ezagutzeari erreferentzia egiteko. Erabilera hori anbiguoa izan daiteke, hiztun-ezagutze automatikoari buruz (hitz egiten ari den pertsona ezagutzeaz), edo esaten ari dena ezagutzeaz? Hizketa-ezagutzearen aplikazioen artean hauek aipa daitezke: Ahots-bidezko markaketa telefonoa (adibidez, "Deitu etxera"), deien igorpenarako (adibidez, "Taldeko dei bat egin nahiko nuke"), aplikazio domotikoen kontrola eta audioan oinarritutako edukien bilaketa egiteko (ad., hitz jakin batzuk ahoskatuak izan diren podcast bat bilatu), informazio bakunaren sarreretarako (ad. Kreditu txartel baten erabilera), estrukturatutako dokumentuen prestakuntzarako (ad., irizpen erradiologiakoak), ahoskeratik testurako prozesaketarako (ad., hitz prozesagailua edo e-mailak), eta hegazkinen garlingetan ( normalean Ahots Sarrera Zuzena bezala ezagututa) erabiltzen da. (eu)
  • El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es una disciplina de la inteligencia artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras. El problema que se plantea en un sistema de este tipo es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido. Un sistema de reconocimiento de voz es una herramienta computacional capaz de procesar la señal de voz emitida por el ser humano y reconocer la información contenida en ésta, convirtiéndola en texto o emitiendo órdenes que actúan sobre un proceso. En su desarrollo intervienen diversas disciplinas, tales como: la fisiología, la acústica, la lingüística, el procesamiento de señales, la inteligencia artificial y la ciencia de la computación. (es)
  • La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance de la parole, ainsi que la synthèse de la parole, l'identification du locuteur ou la vérification du locuteur, font partie des techniques de traitement de la parole. Ces techniques permettent notamment de réaliser des interfaces homme-machine (IHM) où une partie de l'interaction se fait à la voix : « interfaces vocales ». Parmi les nombreuses applications, on peut citer les applications de sur ordinateur où la difficulté tient à la taille du vocabulaire et à la longueur des phrases, mais aussi les applications téléphoniques de type serveur vocal interactif, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics). Dans Parole et dialogue homme-machine, W. Minker et S. Bennacef expliquent que la reconnaissance automatique de la parole est un domaine complexe, car il existe une différence importante entre le langage formel, qui est compris et utilisé par les machines, et le langage naturel, que les humains utilisent. Le langage formel est structuré par des règles syntaxiques strictes et sans ambigüité. À l'inverse, dans le langage naturel, des mots ou des phrases peuvent avoir plusieurs sens selon l'intonation de l'énonciateur ou le contexte par exemple. (fr)
  • Pengenalan ucapan atau pengenalan wicara—dalam istilah bahasa Inggrisnya, automatic speech recognition (ASR)—adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara. Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar sifatnya masih tergantung kepada pembicara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi ini yang sifatnya tidak tergantung pada pembicara. Alat ini sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata. Pengenalan ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua, yaitu pengenalan pembicara (identifikasi suara berdasarkan orang yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang diucapkan). (in)
  • Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale. Sistemi di riconoscimento vocale vengono utilizzati per applicazioni vocali automatizzate nel contesto delle applicazioni telefoniche, ad esempio call center automatici, per sistemi di dettatura (in inglese dictation system), che consentono di dettare discorsi al computer, oppure per sistemi di controllo del sistema di navigazione satellitare o del telefono in auto tramite comandi vocali. (it)
  • 音声認識(おんせいにんしき、英: speech recognition)とは、人間の声などをコンピューターに認識させることであり、話し言葉を文字列に変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能を指す。 (ja)
  • 음성 인식(Speech Recognition)이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말한다. STT(Speech-to-Text)라고도 한다. 키보드 대신 문자를 입력하는 방식으로 주목을 받고 있다. 로봇, 텔레매틱스 등 음성으로 기기제어, 정보검색이 필요한 경우에 응용된다. 대표적인 알고리즘은 HMM(Hidden Markov Model)으로서, 다양한 화자들이 발성한 음성들을 통계적으로 모델링하여 음향모델을 구성하며 말뭉치 수집을 통하여 언어모델을 구성한다. 미리 기록해 둔 음성 패턴과 비교해 개인 인증 등의 용도로 사용하기도 하는데 이를 화자 인식이라고 한다. (ko)
  • Spraakherkenning is een deelgebied van de informatica en computationele taalkunde waarbinnen methoden worden onderzocht en ontwikkeld die het mogelijk maken om automaten, in het bijzonder computers, het gesproken woord te laten herkennen en verwerken. Spraakherkenning moet onderscheiden worden van stemherkenning, een biometrische techniek om een bepaalde persoon aan de hand van zijn stem te kunnen identificeren. De methoden om beide te realiseren zijn echter wel nauw verwant. (nl)
  • Rozpoznawanie mowy – technologia pozwalająca komputerowi lub innemu urządzeniu interpretować mowę ludzką, na przykład do celów transkrypcji lub jako alternatywną metodę interakcji. Dla języka polskiego (stan na rok 2008) dostępne są programy rozpoznające poprawnie 5-9 na 10 wypowiedzianych słów mowy ciągłej (na współczynnik ten, oprócz jakości algorytmu, wpływają m.in. wyrazistość i zrozumiałość mowy). Wartości skuteczności systemów rozpoznawania mowy bardzo zależą od przyjętego scenariusza testu. Dlatego informacje liczbowe, wbrew intuicji, zwykle nie są dobrym odzwierciedleniem jakości takich systemów. Najskuteczniejszą metodą jest porównanie dwóch lub więcej systemów na takim samym scenariuszu testowym. Jakość systemów może jednak także zależeć od tego jak sygnał jest rejestrowany. Przykładowo wiele z systemów oferowanych dla języka polskiego działa dużo gorzej dla sygnału z sieci GSM. Ogólnie należy przyjąć, że rozpoznawanie mowy polskiej działa poprawnie tylko dla pojedynczych słów lub dla ustalonych zbiorów scenariuszy dialogów (stan na marzec 2014). Próg komercyjnej akceptowalności systemów rozpoznawania mowy zwykle przyjmuje się jako 95% poprawności rozpoznania. (pl)
  • Reconhecimento de fala é uma área interdisciplinar originária da linguística computacional cujo objetivo é desenvolver métodos e tecnologias que permitam o reconhecimento e a transcrição de linguagem falada de maneira automática. As tecnologias de reconhecimento de fala são normalmente conhecidas pela sigla em inglês ASR de Automatic Speech Recognition (reconhecimento automático de fala), Computer Speech Recognition (reconhecimento de fala por computador) ou STT de Speech to Text (fala para texto). (pt)
  • Распознавание речи — автоматический процесс преобразования речевого сигнала в цифровую информацию (например, текстовые данные). Обратной задачей является синтез речи. (ru)
  • Taligenkänning, ASR (engelska Automatic Speech Recognition), kallas processen att elektroniskt eller datatekniskt tolka mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer. Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Det bedrivs omfattade forskning kring förståelsen av naturligt tal. Moderna taligenkänningssystem bygger oftast på statistiska metoder där tal tolkas i flera nivåer med hjälp av hypoteser och grammatiker som definierar troliga/kända kombinationer av språkelement. I mer avancerade system är dessa modeller ofta adaptiva och därmed öppna för inlärning av nya grammatikelement genom en halvautomatisk analys av vilka fraser som misslyckas att bli korrekt förstådda, följt av korrigering av de grammatiska och akustiska modellerna. Nivåer i ASR: 1. * akustik - identifiering av fonem, dvs. ljudstyrka för frekvenserkombinationer och akustiskt förlopp 2. * ord - ihopsättning av fonem 3. * ordföljder - urval av troligaste ordföljder jämfört med en stor databas med talat språk 4. * grammatik - verifiering av hypotetiska ordföljder mot grammatik som gäller för det specifika domänen (till exempel en grammatik för biljettbokningar innehåller vanliga fraser och meningar som har med biljetter att göra, men det finns ingen anledning att till exempel ha med grammatik för fotbollsammanhang) 5. * semantik - uttydning av informationsbärande element Enklare ASR förväntar sig enkla svar på frågor, till exempel Fråga: Vart vill du åka? Ange orten!Svar: MalmöFråga: Varifrån vill du åka? ange orten!Svar: Kiruna ASR som kan hantera fritt tal kan under optimala omständigheter klara av komplicerade utsagor som till exempel: Fråga: Beskriv din resa!Svar: Jag vill ta tåget från Kiruna till Malmö, andra klass. Då folk inte talar grammatiskt, och ofta stakar sig så måste man kunna filtrera bort harklingar, upprepade ord, otydliga ord, ord utan betydelse, till exempel Svar: Hmmm Ja just det, vi tar tåget, ta tåget från.. från öööö Kiru.. Kiruna var det till Skåne, till Malmö, ja just det till öööö Malmö skall jag åka. (sv)
  • Розпізнава́ння мо́влення (англ. speech recognition) або мо́влення-у-те́кст (англ. speech to text (STT))— процес перетворення мовленнєвого сигналу в текстовий потік. Не варто плутати із визначенням розпізнавання мови, оскільки «розпізнати мову» безпосередньо означає лише дати відповідь на питання, до якої мови належить сегмент мовленнєвого сигналу. Часто використовується у наборі технологій, що дають змогу керувати комп'ютером, використовуючи людський голос, вводити інформацію голосом, диктувати, транскрибувати (стенографувати) фонограми. (uk)
  • 语音识别(speech recognition)技术,也被称为自动语音识别(英語:Automatic Speech Recognition, ASR)、電腦語音識別(英語:Computer Speech Recognition)或是語音轉文本識別(英語:Speech To Text, STT),其目标是以電腦自動将人类的语音内容转换为相應的文字。与及不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 (zh)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 29468 (xsd:integer)
dbo:wikiPageLength
  • 100504 (xsd:integer)
dbo:wikiPageRevisionID
  • 983530838 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dct:subject
rdf:type
rdfs:comment
  • Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik, der Ingenieurwissenschaften und der Computerlinguistik. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die Automaten, insbesondere Computern, die gesprochene Sprache der automatischen Datenerfassung zugänglich macht. Die Spracherkennung ist zu unterscheiden von der Stimm- bzw. Sprechererkennung, einem biometrischen Verfahren zur Personenidentifikation. Allerdings ähneln sich die Realisierungen dieser Verfahren. (de)
  • 音声認識(おんせいにんしき、英: speech recognition)とは、人間の声などをコンピューターに認識させることであり、話し言葉を文字列に変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能を指す。 (ja)
  • 음성 인식(Speech Recognition)이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말한다. STT(Speech-to-Text)라고도 한다. 키보드 대신 문자를 입력하는 방식으로 주목을 받고 있다. 로봇, 텔레매틱스 등 음성으로 기기제어, 정보검색이 필요한 경우에 응용된다. 대표적인 알고리즘은 HMM(Hidden Markov Model)으로서, 다양한 화자들이 발성한 음성들을 통계적으로 모델링하여 음향모델을 구성하며 말뭉치 수집을 통하여 언어모델을 구성한다. 미리 기록해 둔 음성 패턴과 비교해 개인 인증 등의 용도로 사용하기도 하는데 이를 화자 인식이라고 한다. (ko)
  • Spraakherkenning is een deelgebied van de informatica en computationele taalkunde waarbinnen methoden worden onderzocht en ontwikkeld die het mogelijk maken om automaten, in het bijzonder computers, het gesproken woord te laten herkennen en verwerken. Spraakherkenning moet onderscheiden worden van stemherkenning, een biometrische techniek om een bepaalde persoon aan de hand van zijn stem te kunnen identificeren. De methoden om beide te realiseren zijn echter wel nauw verwant. (nl)
  • Reconhecimento de fala é uma área interdisciplinar originária da linguística computacional cujo objetivo é desenvolver métodos e tecnologias que permitam o reconhecimento e a transcrição de linguagem falada de maneira automática. As tecnologias de reconhecimento de fala são normalmente conhecidas pela sigla em inglês ASR de Automatic Speech Recognition (reconhecimento automático de fala), Computer Speech Recognition (reconhecimento de fala por computador) ou STT de Speech to Text (fala para texto). (pt)
  • Распознавание речи — автоматический процесс преобразования речевого сигнала в цифровую информацию (например, текстовые данные). Обратной задачей является синтез речи. (ru)
  • Розпізнава́ння мо́влення (англ. speech recognition) або мо́влення-у-те́кст (англ. speech to text (STT))— процес перетворення мовленнєвого сигналу в текстовий потік. Не варто плутати із визначенням розпізнавання мови, оскільки «розпізнати мову» безпосередньо означає лише дати відповідь на питання, до якої мови належить сегмент мовленнєвого сигналу. Часто використовується у наборі технологій, що дають змогу керувати комп'ютером, використовуючи людський голос, вводити інформацію голосом, диктувати, транскрибувати (стенографувати) фонограми. (uk)
  • 语音识别(speech recognition)技术,也被称为自动语音识别(英語:Automatic Speech Recognition, ASR)、電腦語音識別(英語:Computer Speech Recognition)或是語音轉文本識別(英語:Speech To Text, STT),其目标是以電腦自動将人类的语音内容转换为相應的文字。与及不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 (zh)
  • التعرف على الكلام أو تمييز الكلام ( ويعرف أيضا بتمييز الكلام التلقائي أو تمييز الكلام أو حاسب تمييز الكلام) وهو عبارة عن تحويل الكلمات المنطوقة إلى نص. إن مصطلح " تمييز الصوت" في بعض الأحيان يطلق على أنظمة التمييز التي يجب أن تدرب على متحدث معين، كما هو الحال بالنسبة لمعظم برامج تمييز سطح المكتب. التعرف على المتحدث يستطيع تبسيط مهمة ترجمة الكلام.تمييز الكلام يعتبر حل أوسع يشير إلى تكنولوجيا بإمكانها التعرف على الكلام بدون أن تستهدف متحدث واحد – مثل نظام الاتصال الذي يستطيع التعرف على جميع الأصوات.تطبيقات تمييز الكلام تتضمن: واجهة المستخدم الصوتية مثل الطلب الصوتي ( على سبيل المثال: اتصل بالمنزل )؛ توجيه المكالمات ( على سبيل المثال: أريد عمل مكالمة تليفونية على حساب المتلقي )، التحكم بتطبيق أتمتة المنزل، البحث ( على سبيل المثال: أوجد البودكاست حيث الكلمات كانت منطوقة) إدخال بيانات بسيطة ( ع (ar)
  • El reconeixement automàtic de la parla (RAP) o reconeixement automàtic de veu és una part de la intel·ligència artificial que té com a objectiu permetre la comunicació parlada entre éssers humans i computadores electròniques. Un sistema de reconeixement de veu és una eina computacional, capaç de processar el senyal de veu i reconèixer la informació que porta. Les disciplines que intervenen en aquest procés són, la fisiologia, l'acústica, el processament de senyal (quantificació), la intel·ligència artificial i la ciència computacional. (ca)
  • Rozpoznáváním řeči se rozumí automatický převod mluvené řeči do textu. Metody rozpoznávání řeči jsou citlivé na rozdíly v intonaci i výslovnosti jednotlivých mluvčí, které se snaží překonat složitými výpočetními operacemi. Proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči. Existují použitelné komerční programy. Pro angličtinu (a další jazyky) zřejmě nejpokročilejším z nich Dragon Naturally Speaking spojený s IBM ViaVoice alias "Nuance Dragon". Pro češtinu se jedná o NovaVoice a NewtonDictate. (cs)
  • Στην επιστήμη της πληροφορικής, η αναγνώριση ομιλίας αναφέρεται στην μετάφραση προφερόμενων σε κείμενο. Είναι επίσης αλλιώς γνωστή και ως "αυτόματη αναγνώριση ομιλίας", "υπολογιστική αναγνώριση ομιλίας" ή "speech-to-text" (STT), δηλαδή (μετατροπή) "από-ομιλία-σε-κείμενο". (el)
  • Speech recognition is an interdisciplinary subfield of computer science and computational linguistics that develops methodologies and technologies that enable the recognition and translation of spoken language into text by computers. It is also known as automatic speech recognition (ASR), computer speech recognition or speech to text (STT). It incorporates knowledge and research in the computer science, linguistics and computer engineering fields. (en)
  • Parolrekonado (ankaŭ nomata 'Aŭtomata Rekonado de parolo' aŭ 'voĉrekonado') estas subfako de la komputa lingvoscienco kiu evoluigas metodojn kaj teknologiojn kiu ebligas la rekonon kaj tradukon de lingva parolo al teksto pere de komputiloj. Ĝi estas ankaŭ konata kiel aŭtomata voĉrekono, komputila parolrekonado aŭ elparolo-alteksto. Ĝi inkluzivas sciojn kaj esplorojn de la kampoj lingvistiko, komputiko kaj elektrotekniko. La Parolrekonado 'estas distingebla de la voĉo aŭ parolanto-rekono, metodo biometria por persona identigo. Tamen, la realigoj de ĉi tiuj proceduroj estas similaj. (eo)
  • Hizketa-ezagutzea hizketa testu bihurtzeko teknologia da. Hizketaren soinua ordenagailuarengandik onda analogikoetan hartuta izaten da, honek analizatuak eta aztertuak izaten dira, soinuaren unitateak identifikatzeko, hau da hitzak eratzen dituzten fonemak. Produkzioa ona eta kalitatezkoa izateko,lan handia suposatzen du zeren modelo ezberdin ugari batu behar dira eta batze honek jarraitua izan behar da. (eu)
  • El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es una disciplina de la inteligencia artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras. El problema que se plantea en un sistema de este tipo es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido. (es)
  • La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. (fr)
  • Pengenalan ucapan atau pengenalan wicara—dalam istilah bahasa Inggrisnya, automatic speech recognition (ASR)—adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perang (in)
  • Il riconoscimento vocale è il processo mediante il quale il linguaggio orale umano viene riconosciuto e successivamente elaborato attraverso un computer o più specificatamente attraverso un apposito sistema di riconoscimento vocale. (it)
  • Rozpoznawanie mowy – technologia pozwalająca komputerowi lub innemu urządzeniu interpretować mowę ludzką, na przykład do celów transkrypcji lub jako alternatywną metodę interakcji. Dla języka polskiego (stan na rok 2008) dostępne są programy rozpoznające poprawnie 5-9 na 10 wypowiedzianych słów mowy ciągłej (na współczynnik ten, oprócz jakości algorytmu, wpływają m.in. wyrazistość i zrozumiałość mowy). Wartości skuteczności systemów rozpoznawania mowy bardzo zależą od przyjętego scenariusza testu. Dlatego informacje liczbowe, wbrew intuicji, zwykle nie są dobrym odzwierciedleniem jakości takich systemów. Najskuteczniejszą metodą jest porównanie dwóch lub więcej systemów na takim samym scenariuszu testowym. Jakość systemów może jednak także zależeć od tego jak sygnał jest rejestrowany. Przy (pl)
  • Taligenkänning, ASR (engelska Automatic Speech Recognition), kallas processen att elektroniskt eller datatekniskt tolka mänskligt, naturligt tal. Naturligt tal räknas som ett viktigt steg för att få intuitiva människostyrda gränssnitt till datorer. Taligenkänning bör inte blandas ihop med röstigenkänning, som behandlar identifiering av vem som talar. Nivåer i ASR: Enklare ASR förväntar sig enkla svar på frågor, till exempel Fråga: Vart vill du åka? Ange orten!Svar: MalmöFråga: Varifrån vill du åka? ange orten!Svar: Kiruna (sv)
rdfs:label
  • Speech recognition (en)
  • تعرف على الكلام (ar)
  • Reconeixement de la parla (ca)
  • Rozpoznávání řeči (cs)
  • Spracherkennung (de)
  • Αναγνώριση ομιλίας (el)
  • Parolrekonado (eo)
  • Reconocimiento del habla (es)
  • Hizketa-ezagutze (eu)
  • Reconnaissance automatique de la parole (fr)
  • Pengenalan ucapan (in)
  • 音声認識 (ja)
  • Riconoscimento vocale (it)
  • 음성 인식 (ko)
  • Spraakherkenning (nl)
  • Rozpoznawanie mowy (pl)
  • Reconhecimento de fala (pt)
  • Распознавание речи (ru)
  • Taligenkänning (sv)
  • Розпізнавання мовлення (uk)
  • 语音识别 (zh)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:academicDiscipline of
is dbo:genre of
is dbo:industry of
is dbo:knownFor of
is dbo:product of
is dbo:regionServed of
is dbo:service of
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:category of
is dbp:field of
is dbp:fields of
is dbp:genre of
is dbp:industry of
is dbp:input of
is dbp:products of
is dbp:services of
is rdfs:seeAlso of
is foaf:primaryTopic of