dbo:abstract
|
- فجوة المفردات هي أحد المشكلات الشائعة في نظم استرجاع المعلومات ومحركات البحث نظراً إلى كون اللغات الطبيعية غنية بالكلمات التي تشير إلى نفس المعنى (ترادف)؛ فإن المستخدم قد يستعمل في البحث كلمات مختلفة عن تلك المستخدمة في الوثائق ذات الصلة، ونتيجة لذلك فإن عدد من النتائج ذات العلاقة لن يتم استرجاعها إذا تم الاعتماد على كلمات البحث فقط. (ar)
- Vocabulary mismatch is a common phenomenon in the usage of natural languages, occurring when different people name the same thing or concept differently. Furnas et al. (1987) were perhaps the first to quantitatively study the vocabulary mismatch problem. Their results show that on average 80% of the times different people (experts in the same field) will name the same thing differently. There are usually tens of possible names that can be attributed to the same thing. This research motivated the work on latent semantic indexing. The vocabulary mismatch between user created queries and relevant documents in a corpus causes the term mismatch problem in information retrieval. Zhao and Callan (2010) were perhaps the first to quantitatively study the vocabulary mismatch problem in a retrieval setting. Their results show that an average query term fails to appear in 30-40% of the documents that are relevant to the user query. They also showed that this probability of mismatch is a central probability in one of the fundamental probabilistic retrieval models, the Binary Independence Model. They developed novel term weight prediction methods that can lead to potentially 50-80% accuracy gains in retrieval over strong keyword retrieval models. Further research along the line shows that expert users can use Boolean Conjunctive Normal Form expansion to improve retrieval performance by 50-300% over unexpanded keyword queries. (en)
- 語彙不一致(Vocabulary mismatch)は自然言語の使用法でよく見られる現象であり、異なる人々が同じものや概念に異なる名前を付けた場合に発生する。 Furnasらは(1987)語彙不一致問題を定量的に研究した研究としておそらく最初の研究である。 彼らは,同じ分野の専門家であっても,平均80%の割合で同じことを違う名前で示すことを明らかにした。 同じものにつけられる可能性のある名前は通常数十存在する。 この研究は潜在意味解析(Latent Semantic Indexing)に関する研究を促すものとなった。 ユーザ作成クエリとコーパス内の関連文書との間の語彙不一致は、 情報検索において用語の不一致の問題の一因となる。 ZhaoとCallan(2010) はおそらく最初に、情報検索場面における語彙ミスマッチ問題を定量的に研究した。 平均的な質問語が、ユーザの質問に関連する文書の30〜40%に現れていないことを彼らは明らかにした。 また彼らは、この語彙不一致の確率が、基本的な確率的検索モデルの1つである二項独立モデルにおける中心的な確率(central probability)であることを示した。 彼らは、強力なキーワード検索モデルよりも潜在的に50〜80%の検索精度の向上をもたらすことができる新しい用語の重み予測方法を開発した。 この線に沿ったさらなる研究では、エキスパートユーザがBoolean Conjunctive Normal Form expansionを使用して、拡張されていないキーワードクエリと比較して検索パフォーマンスを50〜300%向上できることが明らかにされた。 (ja)
|
dbo:wikiPageID
| |
dbo:wikiPageLength
|
- 2658 (xsd:nonNegativeInteger)
|
dbo:wikiPageRevisionID
| |
dbo:wikiPageWikiLink
| |
dbp:wikiPageUsesTemplate
| |
dcterms:subject
| |
gold:hypernym
| |
rdf:type
| |
rdfs:comment
|
- فجوة المفردات هي أحد المشكلات الشائعة في نظم استرجاع المعلومات ومحركات البحث نظراً إلى كون اللغات الطبيعية غنية بالكلمات التي تشير إلى نفس المعنى (ترادف)؛ فإن المستخدم قد يستعمل في البحث كلمات مختلفة عن تلك المستخدمة في الوثائق ذات الصلة، ونتيجة لذلك فإن عدد من النتائج ذات العلاقة لن يتم استرجاعها إذا تم الاعتماد على كلمات البحث فقط. (ar)
- Vocabulary mismatch is a common phenomenon in the usage of natural languages, occurring when different people name the same thing or concept differently. Furnas et al. (1987) were perhaps the first to quantitatively study the vocabulary mismatch problem. Their results show that on average 80% of the times different people (experts in the same field) will name the same thing differently. There are usually tens of possible names that can be attributed to the same thing. This research motivated the work on latent semantic indexing. (en)
- 語彙不一致(Vocabulary mismatch)は自然言語の使用法でよく見られる現象であり、異なる人々が同じものや概念に異なる名前を付けた場合に発生する。 Furnasらは(1987)語彙不一致問題を定量的に研究した研究としておそらく最初の研究である。 彼らは,同じ分野の専門家であっても,平均80%の割合で同じことを違う名前で示すことを明らかにした。 同じものにつけられる可能性のある名前は通常数十存在する。 この研究は潜在意味解析(Latent Semantic Indexing)に関する研究を促すものとなった。 (ja)
|
rdfs:label
|
- فجوة المفردات (ar)
- 語彙不一致 (ja)
- Vocabulary mismatch (en)
|
owl:sameAs
| |
prov:wasDerivedFrom
| |
foaf:isPrimaryTopicOf
| |
is dbo:wikiPageWikiLink
of | |
is foaf:primaryTopic
of | |