About: Speech corpus

Property	Value
dbo:abstract	En linguistique, un corpus oral est un corpus constitué de transcriptions de données orales. (fr) A speech corpus (or spoken corpus) is a database of speech audio files and text transcriptions.In speech technology, speech corpora are used, among other things, to create acoustic models (which can then be used with a speech recognition or speaker identification engine). In linguistics, spoken corpora are used to do research into phonetic, conversation analysis, dialectology and other fields. A corpus is one such database. Corpora is the plural of corpus (i.e. it is many such databases). There are two types of Speech Corpora: 1. * Read Speech – which includes: 2. * Book excerpts 3. * Broadcast news 4. * Lists of words 5. * Sequences of numbers 6. * Spontaneous Speech – which includes: 7. * Dialogs – between two or more people (includes meetings; one such corpus is the KEC); 8. * Narratives – a person telling a story (one such corpus is the Buckeye Corpus); 9. * Map-tasks – one person explains a route on a map to another; 10. * Appointment-tasks – two people try to find a common meeting time based on individual schedules. A special kind of speech corpora are non-native speech databases that contain speech with foreign accent. (en) Речево́й ко́рпус (звуково́й ко́рпус) — база данных аудиофайлов и транскрипций текстов, разновидность корпуса текстов. В речевые корпуса используются, среди прочего, для создания (которые затем могут использоваться в механизмах распознавания речи). В лингвистике речевые корпуса используются для исследований фонетики, диалектологии, конверсационного анализа и в других областях. Существует два типа речевых корпусов:1.Базы начитанных текстов, в том числе: * тексты книг; * тексты трансляций новостей; * списки слов; * последовательности чисел. 2.Базы аудиозаписей спонтанной речи — в том числе: * диалоги — беседы между двумя или более людьми; * устные рассказы (например, Buckeye Corpus); * картографические пояснения — один человек объясняет маршрут на карте другим; * задачи назначения — два человека пытаются найти общее время встречи, основанное на отдельных графиках. Особый вид речевых корпусов — это , которые содержат речь с иностранным акцентом. (ru) 口语语料库为语言音频文件和文字副本的数据库。在里，口语语料库可用于创建声学模型，配合语音识别引擎使用。在语言学里，口语语料库可用于语音学、、方言学等方面的研究。口语语料库主要分为朗读语料和自然口语两类。 (zh)
dbo:wikiPageExternalLink	http://www.linguistics.ucsb.edu/research/santa-barbara-corpus http://buckeyecorpus.osu.edu/ http://spokes.clarin-pl.eu/ http://www.arabicspeechcorpus.com/ http://www.corpora.uni-hamburg.de/sfb538/en_overview.html http://www.phonetik.uni-muenchen.de/Bas/BasHomeeng.html http://www.simmortel.com/speech-recognition-corpus/ http://www.voxforge.org/ https://clarin.phonetik.uni-muenchen.de/BASRepository/index.php%3Ftarget=Public/Corpora/KEC/KEC.1.php http://www.iltec.pt/spock/ http://std.metu.edu.tr/en/ https://digital.lib.hkbu.edu.hk/corpus/ http://www.language-archives.org/ http://www.elra.info/
dbo:wikiPageID	11322771 (xsd:integer)
dbo:wikiPageInterLanguageLink	dbpedia-de:Textkorpus
dbo:wikiPageLength	3993 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1080434585 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Praat dbr:List_of_children's_speech_corpora dbr:Non-native_speech_databases dbc:Corpora dbr:EXMARaLDA dbr:Common_Voice dbr:Conversation_analysis dbr:Arabic_Speech_Corpus dbr:Lingua_Libre dbr:Phonetic dbr:Transcription_(linguistics) dbr:Linguistics dbr:Speech_technology dbr:Spoken_English_Corpus dbr:Database dbr:Dialectology dbr:Speech_recognition dbr:Transcriber dbc:Corpus_linguistics dbc:Dialectology dbr:Acoustic_model dbc:Phonetics dbc:Speech_recognition dbc:Language_documentation dbr:TIMIT dbr:Free_software dbr:Buckeye_Corpus dbr:Non-native_speech_database dbr:The_BABEL_Speech_Corpus dbr:Speaker_identification
dbp:wikiPageUsesTemplate	dbt:Reflist dbt:Corpora-stub dbt:Broader dbt:Natural_Language_Processing
dcterms:subject	dbc:Corpora dbc:Corpus_linguistics dbc:Dialectology dbc:Phonetics dbc:Speech_recognition dbc:Language_documentation
gold:hypernym	dbr:Database
rdf:type	dbo:BiologicalDatabase yago:WikicatCorpora yago:Abstraction100002137 yago:Assets113329641 yago:Capital113353607 yago:Possession100032613 yago:Principal113355868 yago:Relation100031921
rdfs:comment	En linguistique, un corpus oral est un corpus constitué de transcriptions de données orales. (fr) 口语语料库为语言音频文件和文字副本的数据库。在里，口语语料库可用于创建声学模型，配合语音识别引擎使用。在语言学里，口语语料库可用于语音学、、方言学等方面的研究。口语语料库主要分为朗读语料和自然口语两类。 (zh) A speech corpus (or spoken corpus) is a database of speech audio files and text transcriptions.In speech technology, speech corpora are used, among other things, to create acoustic models (which can then be used with a speech recognition or speaker identification engine). In linguistics, spoken corpora are used to do research into phonetic, conversation analysis, dialectology and other fields. A corpus is one such database. Corpora is the plural of corpus (i.e. it is many such databases). There are two types of Speech Corpora: (en) Речево́й ко́рпус (звуково́й ко́рпус) — база данных аудиофайлов и транскрипций текстов, разновидность корпуса текстов. В речевые корпуса используются, среди прочего, для создания (которые затем могут использоваться в механизмах распознавания речи). В лингвистике речевые корпуса используются для исследований фонетики, диалектологии, конверсационного анализа и в других областях. Существует два типа речевых корпусов:1.Базы начитанных текстов, в том числе: * тексты книг; * тексты трансляций новостей; * списки слов; * последовательности чисел. 2.Базы аудиозаписей спонтанной речи — в том числе: (ru)
rdfs:label	Corpus oral (fr) Speech corpus (en) Речевой корпус (ru) 口语语料库 (zh)
owl:sameAs	freebase:Speech corpus yago-res:Speech corpus wikidata:Speech corpus dbpedia-fi:Speech corpus dbpedia-fr:Speech corpus http://hy.dbpedia.org/resource/Բանավոր_խոսքի_կորպուս dbpedia-ru:Speech corpus dbpedia-sl:Speech corpus dbpedia-vi:Speech corpus dbpedia-zh:Speech corpus https://global.dbpedia.org/id/42mPn
prov:wasDerivedFrom	wikipedia-en:Speech_corpus?oldid=1080434585&ns=0
foaf:isPrimaryTopicOf	wikipedia-en:Speech_corpus
is dbo:wikiPageDisambiguates of	dbr:Corpus
is dbo:wikiPageWikiLink of	dbr:List_of_children's_speech_corpora dbr:N-gram dbr:Brian_MacWhinney dbr:Julius_(software) dbr:Persian_Speech_Corpus dbr:VoxForge dbr:EXMARaLDA dbr:Cognitive_Technologies dbr:Corpus_linguistics dbr:Arabic_Speech_Corpus dbr:Lingua_Libre dbr:Transformational_grammar dbr:Catherine_E._Snow dbr:Corpus dbr:Lip_reading dbr:Spoken_English_Corpus dbr:Center_for_the_Evaluation_of_Language_and_Communication_Technologies dbr:Text_corpus dbr:Speech_recognition dbr:Syntactic_Structures dbr:TIMIT dbr:CHILDES dbr:Speech_recognition_software_for_Linux dbr:Buckeye_Corpus dbr:Speech_tempo dbr:TalkBank dbr:Non-native_speech_database dbr:Speech_translation dbr:Outline_of_natural_language_processing dbr:PCVC_Speech_Dataset dbr:Tekstaro_de_Esperanto
is foaf:primaryTopic of	wikipedia-en:Speech_corpus