This HTML5 document contains 86 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

PrefixNamespace IRI
wikipedia-enhttp://en.wikipedia.org/wiki/
n17http://rdues.bcu.ac.uk/
n26http://www.ucl.ac.uk/english-usage/
n37http://www.bmanuel.org/index.
n46http://www.corpus-linguistics.
n29http://en.wikipedia.org/wiki/Corpus_linguistics?oldid=
dbrhttp://dbpedia.org/resource/
n14http://corpus-analysis.com/
n13http://corsis.sourceforge.
n31http://www.corpus.bham.ac.uk/
dcthttp://purl.org/dc/terms/
rdfshttp://www.w3.org/2000/01/rdf-schema#
dbpedia-cshttp://cs.dbpedia.org/resource/
n50http://compbio.uchsc.edu/
n23http://ldc.upenn.
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#
n9https://plus.google.com/u/0/communities/
dbphttp://dbpedia.org/property/
n52http://torvald.aksis.uib.no/corpora/
xsdhhttp://www.w3.org/2001/XMLSchema#
dbpedia-idhttp://id.dbpedia.org/resource/
n33http://www.ling.upenn.edu/
dbohttp://dbpedia.org/ontology/
dbpedia-pthttp://pt.dbpedia.org/resource/
dbpedia-wikidatahttp://wikidata.dbpedia.org/resource/
n38https://groups.google.com/group/
n34https://translate.google.com/translate?hl=en&sl=zh-CN&tl=en&u=http%3A%2F%2Fwww.dmcbc.com.cn%2F
dbpedia-jahttp://ja.dbpedia.org/resource/
n30http://icame.uib.no/journal.
dbchttp://dbpedia.org/resource/Category:
dbpedia-dehttp://de.dbpedia.org/resource/
n22http://www.askoxford.com/oec/mainpage/oec01/?view=
n49http://www.arts-humanities.net/
n39http://rdf.freebase.com/ns/m.
wikidatahttp://www.wikidata.org/entity/
dbpedia-nlhttp://nl.dbpedia.org/resource/
n32http://purl.org/linguistics/gold/
n15http://corpus.byu.edu/
n25http://www.corpus4u.org/
provhttp://www.w3.org/ns/prov#
n45http://www.lancs.ac.uk/fss/courses/ling/
foafhttp://xmlns.com/foaf/0.1/
n24http://www.ucl.ac.uk/english-usage/resources/
n47http://www.benjamins.com/cgi-bin/t_seriesview.cgi?series=
dbpedia-kohttp://ko.dbpedia.org/resource/
n4http://www.uow.edu.au/~dlee/CBLLinks.
n8http://www.dmcbc.com.cn/
n44http://www.peterlang.com/Index.cfm?vSiteName=SearchSeriesResult.cfm&vSeriesID=
n48http://dbpedia.org/resource/Stefan_Th.
dbpedia-eshttp://es.dbpedia.org/resource/
n51http://www.metadiscourseacrossgenres.com/
n10http://ifa.amu.edu.pl/~kprzemek/biblios/corpling.
owlhttp://www.w3.org/2002/07/owl#
Subject Item
dbr:Corpus_linguistics
rdf:type
dbo:Book owl:Thing
rdfs:label
Korpuslinguistik لغويات المتون Corpustaalkunde コーパス言語学 Lingüística de corpus 语料库语言学 Corpus linguistics Корпусная лингвистика Linguística de corpus
rdfs:comment
Corpustaalkunde of corpuslinguïstiek is de studie van bepaalde taalverschijnselen met behulp van een verzameling geannoteerde teksten. Zulke verzamelingen van teksten worden corpora genoemd. Zaken die vaak worden onderzocht zijn de frequentie van bepaalde woorden en de typische contexten waarin ze opduiken. Dit gebeurt tegenwoordig over het algemeen digitaal. Voordat de computer werd uitgevonden maakte men hiervoor gebruik van concordanties, in de vorm van handmatig opgestelde overzichten van de contexten waarin een bepaald woord werd aangetroffen. Aan het eind van de 17e eeuw deed Abraham Trommius bijvoorbeeld iets dergelijks voor de Bijbel. Corpus linguistics is the study of language as expressed in corpora (samples) of "real world" text. The text-corpus method is a digestive approach for deriving a set of abstract rules, from a text, for governing a natural language, and how that language relates to and with another language; originally derived manually, corpora now are automatically derived from the source texts. Corpus linguistics proposes that reliable language analysis is more feasible with corpora collected in the field, in their natural contexts, and with minimal experimental-interference. Linguística de corpus (ou córpus) é uma área da Linguística que se ocupa da coleta e análise de corpus, que é um conjunto de dados linguísticos coletados criteriosamente para serem objeto de pesquisa linguística. O corpus deve ser constituído de dados autênticos (não inventados), legíveis por computador e representativos de uma língua ou variedade da língua da qual se deseja estudar. A Linguística de Corpus faz uso de uma abordagem empirista, distinta da abordagem racionalista, do ponto de vista linguístico, e tem como central a noção de linguagem enquanto sistema probabilístico. Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники. Целесообразность создания текстовых корпусов объясняется: コーパス言語学(コーパスげんごがく、英: corpus linguistics)とは、言語学の一分野で、計算言語学と関連がある。 25بك المحتوى هنا ينقصه الاستشهاد بمصادر. يرجى إيراد مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (مارس 2016) لغويات المتون (Corpus Linguistics) هي دراسة اللغة المجموعة والموضحة في متن أو مكنز نصي. وهذه الطريقة تمثل نهج موجز لاستخلاص قواعد مجردة تخضع لها اللغة الطبيعية. في الاصل تتم هذه الدراسة أو المعالجة يدويا لكن الان المتون تتم دراستها بعمليات مؤتمته (automated process). مختصون لغويات المتون يعتقدون انه أفضل تحليل لغة موثوق يمكن ظهوره في عينات المتون المجمعة في مجال محدد (مثل الصحف أو الاخبار أو الطب... الخ) في سياقاتها الطبيعية مع القليل من التدخل التجريبي. 语料库语言学(英语:corpus linguistics)是基于语言运用的实例(即语料库)的语言研究。语料库语言学可以对自然语言进行语法与句法分析,还可以研究它与其他语言的关系。语料库最初由手工完成,而现在主要是由计算机自动完成。 语料库语言学家相信,可靠的语言分析需建立在新鲜的语料、自然的语言环境,和最小的实验干扰之上。在语料库语言学中,语料标注的意义众说纷纭,从约翰·辛克莱主张最少量的标注,并允许文本“为自己说话”,到“英语用法调查组”(设在伦敦大学学院)鼓励更多的标注,并认为它是通向更完备和严谨的语言理解的道路。 Die Korpuslinguistik ist ein Bereich der Sprachwissenschaft. Darin werden neue Erkenntnisse über Sprache generell oder über bestimmte einzelne Sprachen erlangt oder bestehende Hypothesen überprüft, wobei als Grundlage quantitative oder qualitative Daten dienen, die aus der Analyse von speziellen Textkorpora oder (seltener) Korpora gesprochener Sprache gewonnen werden. Große Verbreitung fand die Korpuslinguistik im deutschsprachigen Raum ab der zweiten Hälfte der 1990er Jahre. Sie steht, wissenschaftstheoretisch betrachtet, dem augenblicklich herrschenden Paradigma des Generativismus entgegen. Es ist nach wie vor umstritten, ob es sich bei der Korpuslinguistik um eine Methode oder um einen eigenen neuen Zweig der Sprachwissenschaft handelt. La lingüística de corpus estudia el lenguaje a través de ejemplos de textos reales producidos en el "mundo real". Este método representa un enfoque que infiere un conjunto de reglas abstractas por el cual una lengua natural se gobierna o se refiere a otro idioma. Antiguamente se hacían a mano pero hoy en día los corpus lingüísticos se obtienen mayoritariamente mediante un proceso automatizado.
owl:sameAs
dbpedia-ko:말뭉치_언어학 wikidata:Q865083 dbpedia-ja:コーパス言語学 dbpedia-nl:Corpustaalkunde dbpedia-wikidata:Q865083 dbpedia-pt:Linguística_de_corpus dbpedia-de:Korpuslinguistik dbpedia-cs:Korpusová_lingvistika n39:0b14y dbpedia-es:Lingüística_de_corpus dbpedia-id:Linguistik_korpus
dct:subject
dbc:Applied_linguistics dbc:Linguistic_research dbc:Linguistic_history dbc:Discourse_analysis dbc:Corpus_linguistics
dbo:wikiPageID
40277
dbo:wikiPageRevisionID
744180773
dbo:wikiPageExternalLink
n4:htm n8: n9:101266284417587206243 n10:zip n13:net n14: n15: n17: n22:uk n23:edu n24:ftfs n24:icecup n25: n26: n30:html n31: n33:hist-corpora n34: n37:html n38:corpling-with-r n44:ECL n45:corpus n46:com n47:SCL n49:text_mining n50:corpora n51: n52:
foaf:isPrimaryTopicOf
wikipedia-en:Corpus_linguistics
prov:wasDerivedFrom
n29:744180773
dbo:abstract
语料库语言学(英语:corpus linguistics)是基于语言运用的实例(即语料库)的语言研究。语料库语言学可以对自然语言进行语法与句法分析,还可以研究它与其他语言的关系。语料库最初由手工完成,而现在主要是由计算机自动完成。 语料库语言学家相信,可靠的语言分析需建立在新鲜的语料、自然的语言环境,和最小的实验干扰之上。在语料库语言学中,语料标注的意义众说纷纭,从约翰·辛克莱主张最少量的标注,并允许文本“为自己说话”,到“英语用法调查组”(设在伦敦大学学院)鼓励更多的标注,并认为它是通向更完备和严谨的语言理解的道路。 コーパス言語学(コーパスげんごがく、英: corpus linguistics)とは、言語学の一分野で、計算言語学と関連がある。 Corpustaalkunde of corpuslinguïstiek is de studie van bepaalde taalverschijnselen met behulp van een verzameling geannoteerde teksten. Zulke verzamelingen van teksten worden corpora genoemd. Zaken die vaak worden onderzocht zijn de frequentie van bepaalde woorden en de typische contexten waarin ze opduiken. Dit gebeurt tegenwoordig over het algemeen digitaal. Voordat de computer werd uitgevonden maakte men hiervoor gebruik van concordanties, in de vorm van handmatig opgestelde overzichten van de contexten waarin een bepaald woord werd aangetroffen. Aan het eind van de 17e eeuw deed Abraham Trommius bijvoorbeeld iets dergelijks voor de Bijbel. Linguística de corpus (ou córpus) é uma área da Linguística que se ocupa da coleta e análise de corpus, que é um conjunto de dados linguísticos coletados criteriosamente para serem objeto de pesquisa linguística. A linguística de corpus surgiu com a necessidade que estudiosos da língua sentiram de se apoiar em usos reais para fazerem generalizações ou esboçarem teorias a respeito do funcionamento linguístico. Atualmente, a linguística de corpus está intimamente ligada ao uso do computador, visto que os corpora/córpora (plural de corpus) são eletrônicos. Assim, a linguística de corpus contemporânea caracteriza-se pela coleta e análise de corpora eletrônicos com o auxílio de ferramentas eletrônicas. O corpus deve ser constituído de dados autênticos (não inventados), legíveis por computador e representativos de uma língua ou variedade da língua da qual se deseja estudar. O computador desempenha um papel importante para os estudos na área. As ferramentas computacionais são geralmente utilizadas para reorganização e extração de informações no corpus para observação e interpretação de dados, fornecendo novas perspectivas para a análise linguística. As ferramentas computacionais mais comuns são: * Programas para listar palavras - fazem a contagem das palavras em um corpus; * Concordanciadores - programas que permitem que o usuário procure por palavras específicas em um corpus, fornecendo exaustivas listas para as ocorrências da palavra em contexto; * Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos) de ordem morfossintática, sintática, semântica ou discursiva. A Linguística de Corpus faz uso de uma abordagem empirista, distinta da abordagem racionalista, do ponto de vista linguístico, e tem como central a noção de linguagem enquanto sistema probabilístico. De acordo com essa noção, os traços linguístico não ocorrem de forma aleatória, sendo possível evidenciar e quantificar regularidades (padrões). É comum na área afirmar que a linguagem é padronizada (patterned), isto é, existe uma correlação entre os traços linguísticos e os contextos situacionais de uso da linguagem. Na Linguística de Corpus, a padronização se evidencia por colocações, coligações ou estruturas que se repetem significativamente. Os principais conceitos de padronização na Linguística de Corpus são: colocação, coligação e prosódia semântica. Para muitos pesquisadores, a Linguística de Corpus revolucionou o modo como a linguagem é estudada. Seus achados contribuem para diversas áreas de pesquisa linguística (Lexicografia, Ensino-aprendizagem, Tradução, etc,). As principais áreas da Linguística de Corpus são: * Compilação de corpora; * Desenvolvimento de ferramentas para análise de corpora; * Descrição de linguagem; * Exploração do uso de descrições baseadas em corpora para várias aplicações tal como ensino-aprendizagem de línguas, processamento de linguagem natural por máquinas, reconhecimento de voz e tradução. Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники. Лингвистическим корпусом называют совокупность текстов, собранных в соответствии с определёнными принципами, размеченных по определённому стандарту и обеспеченных специализированной поисковой системой. Иногда корпусом («корпус первого порядка») называют просто любое собрание текстов, объединённых каким-то общим признаком (языком, жанром, автором, периодом создания текстов). Целесообразность создания текстовых корпусов объясняется: * представлением лингвистических данных в реальном контексте; * достаточно большой представительностью данных (при большом объёме корпуса); * возможностью многократного использования единожды созданного корпуса для решения различных лингвистических задач, таких, как например, реализация графематического и лексико-грамматического анализа текста и др. Corpus linguistics is the study of language as expressed in corpora (samples) of "real world" text. The text-corpus method is a digestive approach for deriving a set of abstract rules, from a text, for governing a natural language, and how that language relates to and with another language; originally derived manually, corpora now are automatically derived from the source texts. Corpus linguistics proposes that reliable language analysis is more feasible with corpora collected in the field, in their natural contexts, and with minimal experimental-interference. The field of Corpus Linguistics features divergent views about the value of corpus annotation, ranging from John McHardy Sinclair, who advocates minimal annotation, and so allow texts to speak for themselves; to the Survey of English Usage team (University College, London) who advocate annotation as allowing greater linguistic understanding, by way of rigorous recording. 25بك المحتوى هنا ينقصه الاستشهاد بمصادر. يرجى إيراد مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (مارس 2016) لغويات المتون (Corpus Linguistics) هي دراسة اللغة المجموعة والموضحة في متن أو مكنز نصي. وهذه الطريقة تمثل نهج موجز لاستخلاص قواعد مجردة تخضع لها اللغة الطبيعية. في الاصل تتم هذه الدراسة أو المعالجة يدويا لكن الان المتون تتم دراستها بعمليات مؤتمته (automated process). مختصون لغويات المتون يعتقدون انه أفضل تحليل لغة موثوق يمكن ظهوره في عينات المتون المجمعة في مجال محدد (مثل الصحف أو الاخبار أو الطب... الخ) في سياقاتها الطبيعية مع القليل من التدخل التجريبي. Die Korpuslinguistik ist ein Bereich der Sprachwissenschaft. Darin werden neue Erkenntnisse über Sprache generell oder über bestimmte einzelne Sprachen erlangt oder bestehende Hypothesen überprüft, wobei als Grundlage quantitative oder qualitative Daten dienen, die aus der Analyse von speziellen Textkorpora oder (seltener) Korpora gesprochener Sprache gewonnen werden. Große Verbreitung fand die Korpuslinguistik im deutschsprachigen Raum ab der zweiten Hälfte der 1990er Jahre. Sie steht, wissenschaftstheoretisch betrachtet, dem augenblicklich herrschenden Paradigma des Generativismus entgegen. Es ist nach wie vor umstritten, ob es sich bei der Korpuslinguistik um eine Methode oder um einen eigenen neuen Zweig der Sprachwissenschaft handelt. La lingüística de corpus estudia el lenguaje a través de ejemplos de textos reales producidos en el "mundo real". Este método representa un enfoque que infiere un conjunto de reglas abstractas por el cual una lengua natural se gobierna o se refiere a otro idioma. Antiguamente se hacían a mano pero hoy en día los corpus lingüísticos se obtienen mayoritariamente mediante un proceso automatizado. En la filología forman los corpus aquellos textos, orales o escritos, y los documentos que los contienen, que han sido debidamente recopilados. Estos corpus constituyen las muestras que se utilizan en lingüística aplicada, entre otros, para estudiar y analizar las características del objeto de estudio, pues integran las muestras de los elementos que constituyen la realidad que se quiere observar. Tanto si es oral como escrito, un corpus deberá definirse en función de los objetivos que se persigan con el mismo. Los partidarios de la lingüística de corpus creen que el análisis lingüístico más fiable se produce en las muestras recogidas en contextos naturales y con una interferencia mínima. Dentro de la lingüística de corpus hay puntos de vista divergentes en cuanto al valor de la anotación de corpus, desde el punto de vista de John Sinclair, que opta por la anotación mínima y permitiendo a los textos "hablar por sí mismos" hasta otros como el del equipo de Survey of English Usage (con sede en la University College, Londres) que apoyan la anotación como un camino hacia una mayor comprensión lingüística y de mayor rigor.
n32:hypernym
dbr:Study
Subject Item
dbr:Concordancing
dbo:wikiPageRedirects
dbr:Corpus_linguistics
Subject Item
dbr:Anne_Curzan
dbp:mainInterests
dbr:Corpus_linguistics
Subject Item
dbr:Corpus
dbo:wikiPageDisambiguates
dbr:Corpus_linguistics
Subject Item
dbr:Mahmood_Bijankhan
dbp:mainInterests
dbr:Corpus_linguistics
Subject Item
dbr:Adam_Kilgarriff
dbo:field
dbr:Corpus_linguistics
Subject Item
n48:_Gries
dbo:field
dbr:Corpus_linguistics
Subject Item
wikipedia-en:Corpus_linguistics
foaf:primaryTopic
dbr:Corpus_linguistics
Subject Item
dbr:Corpus-based_analysis
dbo:wikiPageRedirects
dbr:Corpus_linguistics