An Entity of Type: Election, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

In corpus linguistics, part-of-speech tagging (POS tagging or PoS tagging or POST), also called grammatical tagging is the process of marking up a word in a text (corpus) as corresponding to a particular part of speech, based on both its definition and its context.A simplified form of this is commonly taught to school-age children, in the identification of words as nouns, verbs, adjectives, adverbs, etc.

Property Value
dbo:abstract
  • La desambiguació lèxica, anomenada en anglès part-of-speech tagging, consisteix a obtindre la categoria gramatical de cadascuna de les paraules que formen un text, eliminant l'ambigüitat que puguen tindre determinades paraules (al poder pertànyer a més d'una categoria gramatical). A l'hora d'assignar una categoria gramatical a una paraula podem fer-ho bansant-nos únicament en eixa paraula, o utilitzant informació del context (depenent del mètode, emprarem la informació de les paraules veïnes o de tota la frase, paràgraf o text). (ca)
  • في علم معالجة اللغات الطبيعية تصنيف أقسام الكلام هي عملية تعليم أو تدليل الكلمات في نص أو متن نصي إلى نوع محدد من أجزاء الكلام المقابل لهذه الكلمة مثل (يأكل: فعل)، بناء على تعريف الكلمة وسياقها. كان هذا التصنيف يعمل يدويا وألان يتم في سياق اللغويات الحاسوبية باستخدام بعض الخوارزميات المتخصصة في ذلك. هناك نوعان من تصنيف أجزاء الكلام: الأول يعتمد على القواعد والثاني على الاحتمالات الإحصائية.في العملية تصنيف أجزاء الكلام ليست سهلة كما تبدو لأن هناك كثير من الغموض واللبس في كثير من الحالات. مثل لو افترضنا كلمة ذهب في العربية هل تعني الفعل ذهب أي غادر ام الاسم ذهب وهو نوع من المعادن؟ من السهل معرفة نوع الكلمة من سياق الكلام بالنسبة للإنسان لكن بالنسبة للكمبيوتر العملية أكثر تعقيد. أيضا من المشكلات التي تواجه تصنيف الأقسام إذا كان النص يحتوي على كلمتين بنهم شرطة تمثل ككلمة واحدة وغيرها من المشاكل العديدة. (ar)
  • Unter Part-of-speech-Tagging (POS-Tagging) versteht man die Zuordnung von Wörtern und Satzzeichen eines Textes zu Wortarten (englisch part of speech). Hierzu wird sowohl die Definition des Wortes als auch der Kontext (z. B. angrenzende Adjektive oder Nomen) berücksichtigt. (de)
  • Corpus hizkuntzalaritzan, kategoria gramatikalen etiketatzea (ingelesez part-of-speech tagging, POS tagging edo POST), testu (corpus) batean hitz jakin bati dagokion kategoria gramatikala etiketatze-prozesuari deritzo. Horretarako, hitzaren beraren definizioan eta bere testuinguruan —hau da, bere ondoko eta erlazionatutako hitzetan, perpaus, esaldi edo paragrafoan— oinarritzen da. Horren sinplifikazio bat irakatsi ohi zaie eskola-umeei, izenak, aditzak, adjektiboak, adberbioak, eta abar gisa identifikatzeko hitzak.Kanpo loturak Garai batean eskuz eta hitz gutxirekin egiten zena, orain modu erdiautomatikoan eta masiboki egiten da hizkuntzalaritza konputazionalaren testuinguruan, termino diskretuak zein ezkutuko elipsiak dagokien etiketa gramatikalekin lotuz algoritmoak erabiliz. Kategoria gramatikalen etiketatze-algoritmo hauek bi multzotan bereizten dira: erregeletan oinarritutakoak eta estokastikoak. , ingeleserako lehenengotarikoa, eta gehien erabilia izan dena, erregela bidezkoa da. Eustagger da euskarazko testuak kategoriarekin etiketatzeko aplikazioetako bat. (eu)
  • En lingüística computacional, el etiquetado gramatical (conocido también por su nombre en inglés, part-of-speech tagging, POS tagging o POST) es el proceso de asignar (o etiquetar) a cada una de las palabras de un texto su categoría gramatical. Este proceso se puede realizar de acuerdo con la definición de la palabra o el contexto en que aparece, por ejemplo su relación con las palabras adyacentes en una , oración (como realiza el desambiguador léxico en ventana deslizante), o en un párrafo. Uno de los usos de este etiquetado tiene lugar en el contexto de la lingüística computacional, mediante el empleo de algoritmos que realizan el etiquetado mediante etiquetas descriptivas predefinidas. (es)
  • In corpus linguistics, part-of-speech tagging (POS tagging or PoS tagging or POST), also called grammatical tagging is the process of marking up a word in a text (corpus) as corresponding to a particular part of speech, based on both its definition and its context.A simplified form of this is commonly taught to school-age children, in the identification of words as nouns, verbs, adjectives, adverbs, etc. Once performed by hand, POS tagging is now done in the context of computational linguistics, using algorithms which associate discrete terms, as well as hidden parts of speech, by a set of descriptive tags. POS-tagging algorithms fall into two distinctive groups: rule-based and stochastic. E. Brill's tagger, one of the first and most widely used English POS-taggers, employs rule-based algorithms. (en)
  • En linguistique, l'étiquetage morpho-syntaxique (aussi appelé étiquetage grammatical, POS tagging (part-of-speech tagging) en anglais) est le processus qui consiste à associer aux mots d'un texte les informations grammaticales correspondantes comme la partie du discours, le genre, le nombre, etc. à l'aide d'un outil informatique. (fr)
  • Dalam linguistik, penandaan kelas kata (bahasa Inggris: part-of-speech tagging atau disingkat POST) adalah proses penandaan kata pada suatu teks (korpus) dalam kaitannya dengan suatu kelas kata tertentu berdasarkan definisi dan maknanya--hubungannya dengan kata yang mendampingi atau yang terkait dengannya pada suatu frasa, kalimat, atau paragraf. Bentuk sederhana proses ini adalah identifikasi kata sebagai nomina, verba, adjektiva, adverbia, dll. POST merupakan bagian kajian linguistik komputasional dan pemrosesan bahasa alami serta dilakukan melalui algoritme yang menghubungkan suatu istilah terpisah, berikut bagian tersembunyi wicara, dengan himpunan tanda deskriptif. * l * * s (in)
  • L'analisi grammaticale è il procedimento per identificare la categoria lessicale (e le relative sottocategorie) di ogni parola nel contesto nel quale è usata. Ogni parola può appartenere a una delle nove categorie lessicali dell'italiano, cinque variabili: articolo, aggettivo, sostantivo o nome, pronome, verbo, e quattro invariabili: avverbio, preposizione, congiunzione, interiezione o esclamazione. (it)
  • Part-of-speech tagging is een softwaremethode die parts-of-speech (woordsoorten en eventuele kenmerken) toekent aan woorden in een zin. Gezien het feit dat woorden vaak tot meer dan één woordsoort kunnen behoren ("eten" kan bijvoorbeeld een werkwoord zijn, maar ook een zelfstandig naamwoord) is het de taak van de tagger om te tussen de verschillende mogelijkheden. Er bestaan stochastische taggers, die gebruikmaken van getagde corpora als trainingsmateriaal en die vaak gebruikmaken van de waarschijnlijkheid dat een bepaald woord tot een bepaalde woordsoort behoort op basis van de twee voorgaande woorden. Dit noemen we een trigramtagger. Er bestaan regelgebaseerde taggers, die gebruikmaken van linguïstische regels over welke woordsoort in welke positie kan voorkomen. Daarnaast bestaan er ook nog hybride taggers die gebruikmaken van een combinatie van beide methodes. (nl)
  • Ordklasstaggning är processen för att märka upp ordklass eller andra syntaktiskaklasser till ord i en korpus, och det är en språkteknologisk metod. Före ordklasstaggning måste en separering av ord i en text göras, det kallas (ibland tokenisering). Skiljetecken och interpunktionstecken som till exempel punkt (.), kommatecken , kolon (:), semikolon och talstreck (-) separeras också från orden och märks upp. Ordklasstaggning är en disambigueringsuppgift eftersom ord kan vara flertydiga.Problemet med ordklasstaggning är att särskilja flertydigheten, att välja rätt ordklass för kontexten. Ordklasstaggare är antingen eller stokastiska. Regelbaserad taggare, för automatisk tilldelning av ordklass, använder lexikon och en mängd handskrivna disambigueringsregler som avgör vilken ordklass ett ord tillhör genom att se till kontexten. En stokastisk taggare består av ett lexikon, en träningskorpus samt programvara som tillämpar den så kallade Viterbialgoritmen som hittar den troligaste tillståndsföljden i en dold Markovmodell. Lexikonet listar alla ord som förekommer i träningskorpusen antingen som lemmaformer eller som böjda former och deras möjliga ordklasstaggar. Ett lexikon är i regel finit, men vissa taggare tillämpar i stället en morfologisk skanner. En morfologisk skanners främsta fördel är att den kan tagga även ord som inte förekommer i lexikonet och på så sätt ”lära sig”. En träningskorpus fungerar som konsultation till lexikonet för att avgöra ett ords lexikala tillhörighet. Det är oerhört viktigt att träningskorpusen är helt tillförlitlig, således måste den taggas för hand. (sv)
  • Частеречная разметка (автоматическая морфологическая разметка, POS tagging, part-of-speech tagging) — этап автоматической обработки текста, задачей которого является определение части речи и грамматических характеристик слов в тексте (корпусе) с приписыванием им соответствующих тегов. POS tagging является одним из первых этапов компьютерного анализа текста. Алгоритмы POS tagging делятся на две группы: основанные на правилах и вероятностные. Могут использоваться скрытые марковские модели. (ru)
  • У корпусній лінгвістиці, розмічування частин мови (англ. part-of-speech tagging, POS tagging, POST), також називається граматичним позначенням або розбором на частини мови, це процес позначення слова в тексті (корпусі) належним до певної частини мови, заснований як на його визначенні, так і на його контексті — тобто, на його зв'язку з суміжними і спорідненими словами у фразі, реченні, або абзаці.Спрощена форма корпусної лінгвістики зазвичай викладається дітям шкільного віку, у вигляді визначення слів як іменник, дієслово, прикметник, прислівник, тощо. Зумівши виконати визначення частин мови вручну, це почали робити в контексті обчислювальної лінгвістики, використовуючи алгоритми, які асоціюють дискретні терміни, а також приховані частини мови, відповідно до набору описових позначень. Алгоритми розбору на частини мови поділяються на дві відмінні групи: на основі правил і на стохастичні. , один з перших і найбільш широко використовуваних англійських розбірників, використовує алгоритми на основі правил. (uk)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 746912 (xsd:integer)
dbo:wikiPageLength
  • 19894 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1110132822 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • La desambiguació lèxica, anomenada en anglès part-of-speech tagging, consisteix a obtindre la categoria gramatical de cadascuna de les paraules que formen un text, eliminant l'ambigüitat que puguen tindre determinades paraules (al poder pertànyer a més d'una categoria gramatical). A l'hora d'assignar una categoria gramatical a una paraula podem fer-ho bansant-nos únicament en eixa paraula, o utilitzant informació del context (depenent del mètode, emprarem la informació de les paraules veïnes o de tota la frase, paràgraf o text). (ca)
  • Unter Part-of-speech-Tagging (POS-Tagging) versteht man die Zuordnung von Wörtern und Satzzeichen eines Textes zu Wortarten (englisch part of speech). Hierzu wird sowohl die Definition des Wortes als auch der Kontext (z. B. angrenzende Adjektive oder Nomen) berücksichtigt. (de)
  • En linguistique, l'étiquetage morpho-syntaxique (aussi appelé étiquetage grammatical, POS tagging (part-of-speech tagging) en anglais) est le processus qui consiste à associer aux mots d'un texte les informations grammaticales correspondantes comme la partie du discours, le genre, le nombre, etc. à l'aide d'un outil informatique. (fr)
  • L'analisi grammaticale è il procedimento per identificare la categoria lessicale (e le relative sottocategorie) di ogni parola nel contesto nel quale è usata. Ogni parola può appartenere a una delle nove categorie lessicali dell'italiano, cinque variabili: articolo, aggettivo, sostantivo o nome, pronome, verbo, e quattro invariabili: avverbio, preposizione, congiunzione, interiezione o esclamazione. (it)
  • Частеречная разметка (автоматическая морфологическая разметка, POS tagging, part-of-speech tagging) — этап автоматической обработки текста, задачей которого является определение части речи и грамматических характеристик слов в тексте (корпусе) с приписыванием им соответствующих тегов. POS tagging является одним из первых этапов компьютерного анализа текста. Алгоритмы POS tagging делятся на две группы: основанные на правилах и вероятностные. Могут использоваться скрытые марковские модели. (ru)
  • في علم معالجة اللغات الطبيعية تصنيف أقسام الكلام هي عملية تعليم أو تدليل الكلمات في نص أو متن نصي إلى نوع محدد من أجزاء الكلام المقابل لهذه الكلمة مثل (يأكل: فعل)، بناء على تعريف الكلمة وسياقها. كان هذا التصنيف يعمل يدويا وألان يتم في سياق اللغويات الحاسوبية باستخدام بعض الخوارزميات المتخصصة في ذلك. هناك نوعان من تصنيف أجزاء الكلام: الأول يعتمد على القواعد والثاني على الاحتمالات الإحصائية.في العملية تصنيف أجزاء الكلام ليست سهلة كما تبدو لأن هناك كثير من الغموض واللبس في كثير من الحالات. مثل لو افترضنا كلمة ذهب في العربية هل تعني الفعل ذهب أي غادر ام الاسم ذهب وهو نوع من المعادن؟ من السهل معرفة نوع الكلمة من سياق الكلام بالنسبة للإنسان لكن بالنسبة للكمبيوتر العملية أكثر تعقيد. أيضا من المشكلات التي تواجه تصنيف الأقسام إذا كان النص يحتوي على كلمتين بنهم شرطة تمثل ككلمة واحدة وغيرها من المشاك (ar)
  • En lingüística computacional, el etiquetado gramatical (conocido también por su nombre en inglés, part-of-speech tagging, POS tagging o POST) es el proceso de asignar (o etiquetar) a cada una de las palabras de un texto su categoría gramatical. Este proceso se puede realizar de acuerdo con la definición de la palabra o el contexto en que aparece, por ejemplo su relación con las palabras adyacentes en una , oración (como realiza el desambiguador léxico en ventana deslizante), o en un párrafo. (es)
  • Corpus hizkuntzalaritzan, kategoria gramatikalen etiketatzea (ingelesez part-of-speech tagging, POS tagging edo POST), testu (corpus) batean hitz jakin bati dagokion kategoria gramatikala etiketatze-prozesuari deritzo. Horretarako, hitzaren beraren definizioan eta bere testuinguruan —hau da, bere ondoko eta erlazionatutako hitzetan, perpaus, esaldi edo paragrafoan— oinarritzen da. Horren sinplifikazio bat irakatsi ohi zaie eskola-umeei, izenak, aditzak, adjektiboak, adberbioak, eta abar gisa identifikatzeko hitzak.Kanpo loturak (eu)
  • In corpus linguistics, part-of-speech tagging (POS tagging or PoS tagging or POST), also called grammatical tagging is the process of marking up a word in a text (corpus) as corresponding to a particular part of speech, based on both its definition and its context.A simplified form of this is commonly taught to school-age children, in the identification of words as nouns, verbs, adjectives, adverbs, etc. (en)
  • Dalam linguistik, penandaan kelas kata (bahasa Inggris: part-of-speech tagging atau disingkat POST) adalah proses penandaan kata pada suatu teks (korpus) dalam kaitannya dengan suatu kelas kata tertentu berdasarkan definisi dan maknanya--hubungannya dengan kata yang mendampingi atau yang terkait dengannya pada suatu frasa, kalimat, atau paragraf. Bentuk sederhana proses ini adalah identifikasi kata sebagai nomina, verba, adjektiva, adverbia, dll. POST merupakan bagian kajian linguistik komputasional dan pemrosesan bahasa alami serta dilakukan melalui algoritme yang menghubungkan suatu istilah terpisah, berikut bagian tersembunyi wicara, dengan himpunan tanda deskriptif. (in)
  • Part-of-speech tagging is een softwaremethode die parts-of-speech (woordsoorten en eventuele kenmerken) toekent aan woorden in een zin. Gezien het feit dat woorden vaak tot meer dan één woordsoort kunnen behoren ("eten" kan bijvoorbeeld een werkwoord zijn, maar ook een zelfstandig naamwoord) is het de taak van de tagger om te tussen de verschillende mogelijkheden. (nl)
  • Ordklasstaggning är processen för att märka upp ordklass eller andra syntaktiskaklasser till ord i en korpus, och det är en språkteknologisk metod. Före ordklasstaggning måste en separering av ord i en text göras, det kallas (ibland tokenisering). Skiljetecken och interpunktionstecken som till exempel punkt (.), kommatecken , kolon (:), semikolon och talstreck (-) separeras också från orden och märks upp. (sv)
  • У корпусній лінгвістиці, розмічування частин мови (англ. part-of-speech tagging, POS tagging, POST), також називається граматичним позначенням або розбором на частини мови, це процес позначення слова в тексті (корпусі) належним до певної частини мови, заснований як на його визначенні, так і на його контексті — тобто, на його зв'язку з суміжними і спорідненими словами у фразі, реченні, або абзаці.Спрощена форма корпусної лінгвістики зазвичай викладається дітям шкільного віку, у вигляді визначення слів як іменник, дієслово, прикметник, прислівник, тощо. (uk)
rdfs:label
  • تصنيف أقسام الكلام (ar)
  • Desambiguació lèxica (ca)
  • Part-of-speech-Tagging (de)
  • Etiquetado gramatical (es)
  • Kategoria gramatikalen etiketatzea (eu)
  • Penandaan kelas kata (in)
  • Analisi grammaticale (it)
  • Étiquetage morpho-syntaxique (fr)
  • Part-of-speech tagging (en)
  • Part-of-speech tagging (nl)
  • Частеречная разметка (ru)
  • Розмічування частин мови (uk)
  • Ordklasstaggning (sv)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License