About: Speech corpus

An Entity of Type: Biological database, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

A speech corpus (or spoken corpus) is a database of speech audio files and text transcriptions.In speech technology, speech corpora are used, among other things, to create acoustic models (which can then be used with a speech recognition or speaker identification engine). In linguistics, spoken corpora are used to do research into phonetic, conversation analysis, dialectology and other fields. A corpus is one such database. Corpora is the plural of corpus (i.e. it is many such databases). There are two types of Speech Corpora:

Property Value
dbo:abstract
  • En linguistique, un corpus oral est un corpus constitué de transcriptions de données orales. (fr)
  • A speech corpus (or spoken corpus) is a database of speech audio files and text transcriptions.In speech technology, speech corpora are used, among other things, to create acoustic models (which can then be used with a speech recognition or speaker identification engine). In linguistics, spoken corpora are used to do research into phonetic, conversation analysis, dialectology and other fields. A corpus is one such database. Corpora is the plural of corpus (i.e. it is many such databases). There are two types of Speech Corpora: 1. * Read Speech – which includes: 2. * Book excerpts 3. * Broadcast news 4. * Lists of words 5. * Sequences of numbers 6. * Spontaneous Speech – which includes: 7. * Dialogs – between two or more people (includes meetings; one such corpus is the KEC); 8. * Narratives – a person telling a story (one such corpus is the Buckeye Corpus); 9. * Map-tasks – one person explains a route on a map to another; 10. * Appointment-tasks – two people try to find a common meeting time based on individual schedules. A special kind of speech corpora are non-native speech databases that contain speech with foreign accent. (en)
  • Речево́й ко́рпус (звуково́й ко́рпус) — база данных аудиофайлов и транскрипций текстов, разновидность корпуса текстов. В речевые корпуса используются, среди прочего, для создания (которые затем могут использоваться в механизмах распознавания речи). В лингвистике речевые корпуса используются для исследований фонетики, диалектологии, конверсационного анализа и в других областях. Существует два типа речевых корпусов:1.Базы начитанных текстов, в том числе: * тексты книг; * тексты трансляций новостей; * списки слов; * последовательности чисел. 2.Базы аудиозаписей спонтанной речи — в том числе: * диалоги — беседы между двумя или более людьми; * устные рассказы (например, Buckeye Corpus); * картографические пояснения — один человек объясняет маршрут на карте другим; * задачи назначения — два человека пытаются найти общее время встречи, основанное на отдельных графиках. Особый вид речевых корпусов — это , которые содержат речь с иностранным акцентом. (ru)
  • 口语语料库为语言音频文件和文字副本的数据库。在里,口语语料库可用于创建声学模型,配合语音识别引擎使用。在语言学里,口语语料库可用于语音学、、方言学等方面的研究。 口语语料库主要分为朗读语料和自然口语两类。 (zh)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 11322771 (xsd:integer)
dbo:wikiPageInterLanguageLink
dbo:wikiPageLength
  • 3993 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1080434585 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • En linguistique, un corpus oral est un corpus constitué de transcriptions de données orales. (fr)
  • 口语语料库为语言音频文件和文字副本的数据库。在里,口语语料库可用于创建声学模型,配合语音识别引擎使用。在语言学里,口语语料库可用于语音学、、方言学等方面的研究。 口语语料库主要分为朗读语料和自然口语两类。 (zh)
  • A speech corpus (or spoken corpus) is a database of speech audio files and text transcriptions.In speech technology, speech corpora are used, among other things, to create acoustic models (which can then be used with a speech recognition or speaker identification engine). In linguistics, spoken corpora are used to do research into phonetic, conversation analysis, dialectology and other fields. A corpus is one such database. Corpora is the plural of corpus (i.e. it is many such databases). There are two types of Speech Corpora: (en)
  • Речево́й ко́рпус (звуково́й ко́рпус) — база данных аудиофайлов и транскрипций текстов, разновидность корпуса текстов. В речевые корпуса используются, среди прочего, для создания (которые затем могут использоваться в механизмах распознавания речи). В лингвистике речевые корпуса используются для исследований фонетики, диалектологии, конверсационного анализа и в других областях. Существует два типа речевых корпусов:1.Базы начитанных текстов, в том числе: * тексты книг; * тексты трансляций новостей; * списки слов; * последовательности чисел. 2.Базы аудиозаписей спонтанной речи — в том числе: (ru)
rdfs:label
  • Corpus oral (fr)
  • Speech corpus (en)
  • Речевой корпус (ru)
  • 口语语料库 (zh)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageDisambiguates of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License