In computational linguistics, word-sense disambiguation (WSD) is an open problem of natural language processing and ontology. WSD is identifying which sense of a word (i.e. meaning) is used in a sentence, when the word has multiple meanings. The solution to this problem impacts other computer-related writing, such as discourse, improving relevance of search engines, anaphora resolution, coherence, inference et cetera.

Property Value
dbo:abstract
  • In computational linguistics, word-sense disambiguation (WSD) is an open problem of natural language processing and ontology. WSD is identifying which sense of a word (i.e. meaning) is used in a sentence, when the word has multiple meanings. The solution to this problem impacts other computer-related writing, such as discourse, improving relevance of search engines, anaphora resolution, coherence, inference et cetera. The human brain is quite proficient at word-sense disambiguation. The fact that natural language is formed in a way that requires so much of it is a reflection of that neurologic reality. In other words, human language developed in a way that reflects (and also has helped to shape) the innate ability provided by the brain's neural networks. In computer science and the information technology that it enables, it has been a long-term challenge to develop the ability in computers to do natural language processing and machine learning. To date, a rich variety of techniques have been researched, from dictionary-based methods that use the knowledge encoded in lexical resources, to supervised machine learning methods in which a classifier is trained for each distinct word on a corpus of manually sense-annotated examples, to completely unsupervised methods that cluster occurrences of words, thereby inducing word senses. Among these, supervised learning approaches have been the most successful algorithms to date. Accuracy of current algorithms is difficult to state without a host of caveats. In English, accuracy at the coarse-grained (homograph) level is routinely above 90%, with some methods on particular homographs achieving over 96%. On finer-grained sense distinctions, top accuracies from 59.1% to 69.0% have been reported in recent evaluation exercises (SemEval-2007, Senseval-2), where the baseline accuracy of the simplest possible algorithm of always choosing the most frequent sense was 51.4% and 57%, respectively. (en)
  • 25بك المحتوى هنا ينقصه الاستشهاد بمصادر. يرجى إيراد مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (مارس 2016)25بك هذه المقالة ليس بها أي وصلات لمقالاتٍ أخرى للمساعدة في ترابط مقالات الموسوعة. فضلًا ساعد في تحسين هذه المقالة بإضافة وصلات إلى المقالات المتعلقة بها الموجودة في النص الحالي. (ديسمبر 2013) فك اللبس الدلالي (Word Sense Disambiguation) هو عملية اختيار المعنى المناسب لكل كلمة من كلمات الجملة على أساس السياق (Context). فمثلاً كلمة "مصرف" قد تأتي بمعنى "مكان آمن لحفظ الأموال" وقد تأتي بمعنى آخر "مجرى لصرف المياه" ويتمكن القارئ "البشري" من تحديد المعنى المراد عند قراءة الكلمة وفقًا للسياق الذي وردت فيه وذلك باستعانته بذكائه البشري وقدرته اللغوية ومعلوماته المعرفية. أما الحاسوب فعليه القيام بالعديد من العمليات الحاسوبية حتى يتمكن من فهم الجملة آليًّا وبالتالي تحديد المعنى المناسب وفقًا لفهمه. وتعتبر دقة التعرف على المعنى المناسب في غاية الأهمية أثناء المعالجة الآلية للغة وخاصة في مجال الترجمة الآلية فمثلاً كلمة "مصرف" ستؤدي إلى ترجمة مختلفة (Bank) أو (Drain) وفقًا للاختيار الذي توصل إليه نظام الترجمة الآلية. ومن خلال تحديد وترتيب المواضيع (Themes) المحتملة التي تدور حولها جملة ما بطريقة آلية، يتم فك اللبس الدلالي للكلمات الموضوعية. ويتم تحديد مجموعة المجالات المختلفة للجملة من خلال معلومات موضوعية (Thematic Information) مرتبطة بمعاني الكلمات بالإضافة إلى قواعد معرفية (Knowledge Base). فمثلاً ورود اسم "شارلي شابلن" في جملة ما يدل على أن المجال هو الفن وورود اسم "روبرتو كارلوس" في سياق ما يدل على أن الموضوع رياضي... وهكذا. ويتم فك اللبس الدلالي هذا بطريقة دقيقة من خلال إما تصفية المعاني بعيدة الاحتمال أو اختيار المعاني عالية الاحتمال. والقدرة الفائقة في تحديد مجال الجملة وفك اللبس الدلالي الموضوعي والمبني على مجال السياق، تمكن نظام المعالجة الآلية للغة العربية من فك لبس مبدئي للنص العربي بسرعة هائلة ودقة عالية قبل الانخراط في المراحل التحليلية التقدليدية التالية وبخاصة التحليل الصرفي والدلالي والتركيبي. وهذا التقليص من حجم اللبس الدلالي الموجه لمحركات المعالجة اللغوية التالية يؤدي إلى: 1-زيادة دقة التحليل الآلي وبالتالي دقة الفهم الآلي للنص العربي مما يؤدي إلى زيادة دقة التطبيقات المبنية عليه. 2-تقليل الموارد الحاسوبية (Computational Resources) المطلوبة من حيث الذاكرة (Memory) والمعالج (CPU). 3-تسريع عملية التحليل الآلي. ويتم استخدام هذه الطريقة المبتكرة في العديد من أنظمة المعالجة الآلية للغة العربية وعلى رأسها الترجمة الآلية * 32xبوابة معلوماتية * 32xبوابة لغويات (ar)
  • Disambiguierung (von lateinisch dis- ‚zer‘-, ‚un-‘, ‚auseinander‘ und ambiguus ‚doppeldeutig‘) oder Begriffsklärung wird in der Sprachwissenschaft die Auflösung sprachlicher Mehrdeutigkeiten genannt. (de)
  • En el ámbito de la lingüística computacional, la desambiguación del significado de las palabras es un problema abierto de procesamiento del lenguaje natural, que incluye el proceso de identificar con qué sentido se usa una palabra en los términos de una oración, cuando la palabra en cuestión tiene polisemia, es decir, una pluralidad de significados. La solución de este problema afecta a otras tareas de la lingüística computacional, tales como el discurso, la mejora de la relevancia en los motores de búsqueda, la resolución de referencia, la coherencia textual (lingüística), la inferencia, y otros. (es)
  • La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è l'operazione con la quale si precisa il significato di una parola o di un insieme di parole (frase), che denotano significati diversi a seconda dei contesti e che quindi sono ambigue. Il problema della disambiguazione, mediante appositi algoritmi, riveste particolare importanza nelle ricerche sull'intelligenza artificiale e, in particolare, sull'elaborazione del linguaggio naturale. Specificamente, si prevedono benefici della disambiguazione in programmi di traduzione automatica, recupero dell'informazione, estrazione automatica di informazioni, ecc. I due esempi seguenti riguardano significati distinti della parola rombo: 1. * Ho acquistato un rombo fresco al mercato 2. * Il rombo è una figura geometrica i cui quattro lati hanno la stessa lunghezza Sebbene per un essere umano sia ovvio che la prima frase si riferisce al significato di pesce e la seconda a quello di figura geometrica, sviluppare algoritmi per replicare questa capacità umana è tipicamente difficile. (it)
  • 語義の曖昧性解消(ごぎのあいまいせいかいしょう、英語: Word-sense disambiguation)とは自然言語処理において、文中のある単語に出会ったとき、その単語がどの語義をあらわしているのかを判断する過程のこと。語義識別、語義判別、語義確定などともいう。 自然言語の単語には複数の語義が存在する場合がある。たとえば動詞「やる」には以下のような異なった語義が存在する: * 彼はその仕事をやった。 (ある動作をする) * その日はジャズをやった。 (演奏/上映する) * プレゼントとして時計をやった。 (譲渡する) * 机の上の本を向こうへやった。 (どかす) * 心配なので人をやった。 (遣いを出す) * 目を向こうへやった。 (視線を投げる) 語義の曖昧性解消は機械翻訳などのアプリケーションで非常に重要である。たとえば日本語の「やる」という動詞のもつそれぞれの語義は、ほかの言語では別々の動詞(英語では play, give, remove など)によって表されているためである。現在の自然言語処理では、語義の曖昧性解消には単語の共起関係を使う手法が一般的である。 (ja)
  • La désambiguïsation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc. Le cerveau humain est très habile pour désambiguïser les sens des mots. Le fait que les langues naturelles demandent souvent l'emploi de cette faculté est un reflet de l'habilité du cerveau dans ce domaine. Autrement dit, la mode de développement des langues humaines reflète (et a contribué à former) la capacité innée des réseaux de neurones du cerveau. Par contre, depuis longtemps, le traitement des langues naturelles et l'apprentissage automatique ont posé un défi à l'informatique. (fr)
  • Desambiguação é o termo utilizado na lingüística para se referir ao processo de explicação à mensagem que possui mais de um sentido. Um termo ambíguo é, então, aquele que traz uma mensagem ou instrução confusa e que pode ser interpretado de mais de uma maneira. A desambiguação é utilizada tanto na escrita quanto na fala, na linguagem de sinais, e até em sistemas informatizados — quando dois objetos (ou ações, ou adjetivos, incluindo termos concretos e abstratos) possuem o mesmo nome. (pt)
  • Разрешение лексической многозначности (word sense disambiguation, WSD) — это неразрешенная проблема обработки естественного языка, которая заключается в задаче выбора значения (или смысла) многозначного слова или словосочетания в зависимости от контекста, в котором оно находится. Данная задача возникает в дискурсивном анализе, при оптимизации релевантности результатов поисковыми системами, при разрешении анафорических отсылок, в исследовании лингвистической когерентность текста, при анализе умозаключений. Научные исследования по разрешению лексической многозначности находятся в поле зрения прикладной и компьютерной лингвистики достаточно давно и имеют многолетнюю историю. С течением лет количество предложенных решений и их эффективность неуклонно росли до тех пор, пока эффективность не достигла определённого уровня сравнительно-эффективных показателей точности для определённого спектра слов и типов многозначностей. Полного решения задача пока не получила, поскольку на пути успешного решения стоит много проблем, напрямую связанных с языковыми особенностями человеческой речи. Было исследовано большое количество методов: от методов, основанных на знаниях, правилах, лексикографических источников, обучения с учителем на корпусе текстов, до методов обучения без учителя, кластеризующие слова на основе смысла. Среди перечисленных, на сегодняшний день, методы обучения с учителем показали наилучшую эффективность. Однако, объективное сравнение и оценка методов является сложным процессом, зависящим от многих факторов. Для обобщённых систем словарных знаний (для английского языка) эффективность регулярно превышает планку в 90 %, иногда достигая даже 96 %. Для более дифференцированных словарных систем эффективность находятся в пределе 59 %-69 %. (ru)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 67065 (xsd:integer)
dbo:wikiPageRevisionID
  • 741622591 (xsd:integer)
dct:subject
http://purl.org/linguistics/gold/hypernym
rdf:type
rdfs:comment
  • Disambiguierung (von lateinisch dis- ‚zer‘-, ‚un-‘, ‚auseinander‘ und ambiguus ‚doppeldeutig‘) oder Begriffsklärung wird in der Sprachwissenschaft die Auflösung sprachlicher Mehrdeutigkeiten genannt. (de)
  • 語義の曖昧性解消(ごぎのあいまいせいかいしょう、英語: Word-sense disambiguation)とは自然言語処理において、文中のある単語に出会ったとき、その単語がどの語義をあらわしているのかを判断する過程のこと。語義識別、語義判別、語義確定などともいう。 自然言語の単語には複数の語義が存在する場合がある。たとえば動詞「やる」には以下のような異なった語義が存在する: * 彼はその仕事をやった。 (ある動作をする) * その日はジャズをやった。 (演奏/上映する) * プレゼントとして時計をやった。 (譲渡する) * 机の上の本を向こうへやった。 (どかす) * 心配なので人をやった。 (遣いを出す) * 目を向こうへやった。 (視線を投げる) 語義の曖昧性解消は機械翻訳などのアプリケーションで非常に重要である。たとえば日本語の「やる」という動詞のもつそれぞれの語義は、ほかの言語では別々の動詞(英語では play, give, remove など)によって表されているためである。現在の自然言語処理では、語義の曖昧性解消には単語の共起関係を使う手法が一般的である。 (ja)
  • Desambiguação é o termo utilizado na lingüística para se referir ao processo de explicação à mensagem que possui mais de um sentido. Um termo ambíguo é, então, aquele que traz uma mensagem ou instrução confusa e que pode ser interpretado de mais de uma maneira. A desambiguação é utilizada tanto na escrita quanto na fala, na linguagem de sinais, e até em sistemas informatizados — quando dois objetos (ou ações, ou adjetivos, incluindo termos concretos e abstratos) possuem o mesmo nome. (pt)
  • In computational linguistics, word-sense disambiguation (WSD) is an open problem of natural language processing and ontology. WSD is identifying which sense of a word (i.e. meaning) is used in a sentence, when the word has multiple meanings. The solution to this problem impacts other computer-related writing, such as discourse, improving relevance of search engines, anaphora resolution, coherence, inference et cetera. (en)
  • 25بك المحتوى هنا ينقصه الاستشهاد بمصادر. يرجى إيراد مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (مارس 2016)25بك هذه المقالة ليس بها أي وصلات لمقالاتٍ أخرى للمساعدة في ترابط مقالات الموسوعة. فضلًا ساعد في تحسين هذه المقالة بإضافة وصلات إلى المقالات المتعلقة بها الموجودة في النص الحالي. (ديسمبر 2013) ويتم فك اللبس الدلالي هذا بطريقة دقيقة من خلال إما تصفية المعاني بعيدة الاحتمال أو اختيار المعاني عالية الاحتمال. وهذا التقليص من حجم اللبس الدلالي الموجه لمحركات المعالجة اللغوية التالية يؤدي إلى: * 32xبوابة معلوماتية * 32xبوابة لغويات (ar)
  • En el ámbito de la lingüística computacional, la desambiguación del significado de las palabras es un problema abierto de procesamiento del lenguaje natural, que incluye el proceso de identificar con qué sentido se usa una palabra en los términos de una oración, cuando la palabra en cuestión tiene polisemia, es decir, una pluralidad de significados. (es)
  • La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è l'operazione con la quale si precisa il significato di una parola o di un insieme di parole (frase), che denotano significati diversi a seconda dei contesti e che quindi sono ambigue. I due esempi seguenti riguardano significati distinti della parola rombo: 1. * Ho acquistato un rombo fresco al mercato 2. * Il rombo è una figura geometrica i cui quattro lati hanno la stessa lunghezza (it)
  • La désambiguïsation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc. (fr)
  • Разрешение лексической многозначности (word sense disambiguation, WSD) — это неразрешенная проблема обработки естественного языка, которая заключается в задаче выбора значения (или смысла) многозначного слова или словосочетания в зависимости от контекста, в котором оно находится. Данная задача возникает в дискурсивном анализе, при оптимизации релевантности результатов поисковыми системами, при разрешении анафорических отсылок, в исследовании лингвистической когерентность текста, при анализе умозаключений. (ru)
rdfs:label
  • Word-sense disambiguation (en)
  • فك التباس دلالة الكلمة (ar)
  • Disambiguierung (de)
  • Desambiguación lingüística (es)
  • Disambiguazione (it)
  • Désambiguïsation lexicale (fr)
  • 語義の曖昧性解消 (ja)
  • Desambiguação (pt)
  • Разрешение лексической многозначности (ru)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageRedirects of
is foaf:primaryTopic of