In linguistic morphology, stemming is the process for reducing inflected (or sometimes derived) words to their stem, base or root form – generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. The algorithm has been a long-standing problem in computer science; the first paper on the subject was published in 1968.

PropertyValue
dbpprop:abstract
  • In linguistic morphology, stemming is the process for reducing inflected (or sometimes derived) words to their stem, base or root form – generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. The algorithm has been a long-standing problem in computer science; the first paper on the subject was published in 1968. The process of stemming, often called conflation, is useful in search engines for query expansion or indexing and other natural language processing problems. Stemming programs are commonly referred to as stemming algorithms or stemmers.
  • Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf Wiki und schrieb auf schreiben. Verschiedene Varianten eines Wortes können z. B. entstanden sein durch: Komposition, Dekomposition, Flexion, Derivation z. B. durch Hinzufügen von Affixen.
  • Stemming es un método para reducir una palabra a su raíz o mejor a un stem o tema. Hay algunos algoritmos de stemming que ayudan en sistemas de recuperación de información. Stemming aumenta el recall que es una medida sobre el número de documentos que se pueden encontrar con una consulta. Por ejemplo una consulta sobre "bibliotecas" también encuentra documentos en los que solo aparezca "bibliotecario" porque el stem de las dos palabras es el mismo ("bibliotec").
  • La lexémisation d'un mot est la fonction qui associe un lexème à celui-ci.
  • Lo stemming è il processo di riduzione della forma flessa di una parola alla sua forma radice, detta tema. Il tema non corrisponde necessariamente alla radice morfologica della parola: normalmente è sufficiente che le parole correlate siano mappate allo stesso tema (ad esempio, che andare, andai, andò mappino al tema and), anche se quest'ultimo non è una valida radice per la parola. La creazione di un algoritmo di stemming è stato un annoso problema dell'informatica. Il processo di stemming è utilizzato nei motori di ricerca per l'espansione di interrogazioni e in altri problemi di elaborazione del linguaggio naturale.
  • Стемминг — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемминга представляет собой давнюю проблему в области компьютерных наук. Первый документ по этому вопросу был опубликован в 1968 году. Данный процесс применяется в поиcковых системах для обобщения поискового запроса пользователя. Конкретные реализации стемминга называются алгоритм стемминга или просто стеммер.
  • En stemmer är ett program eller en algoritm som avgör den morfologiska roten av en bestämd böjd (eller ibland härledd) ordform. Engelska stemmers är tämligen enkla (med bara tidivis problematik som ordet "dries" som är tredje person singularis ordform av verbet "dry" och "axes" som är pluralformen av "ax" precis som "axis") men stemmers blir mer svåra att skapa när morfologin, ortografin och teckenkodningen av språket ifråga blir mer komplext. Exempelvis så är en italiensk stemmer mer komplex än en engelsk (beroende på mer potentiella verbböjningar), en rysk stemmer är också mer komplex (beroende på fler kasusböjningar av substantiv), en hebreisk stemmer är ännu mer komplex (beroende på ett vildvuxet skriftspråk) och så vidare. Stemmers är vanliga i frågebaserade system eftersom en användare som söker på ordet "krokodiler" också vill ha dokument som innehåller ordet "krokodil" (utan bokstäverna er). Ett mer komplext förhållningssätt till problemet att avgöra den morfologiska roten till ett ord är lemmatisering. Den första publicerade stemmern någonsin skrevs av Julie Beth Lovins, "Development of a stemming algorithm", Mechanical Translation and Computational Linguistics, 11: 22–31 (1968). Denna artikel var anmärkningsvärd för sin tidiga publicering och hade stort inflytande på senare arbeten med att skapa stemmers. En senare stemmer skrevs av Martin Porter och publicerades i Program, Vol 14 no. 3 pp 130–137, July 1980. Denna stemmer blev vida använd och de-facto standardalgoritm för engelska stemmers. Dr Porter erhöll the Tony Kent Strix Award år 2000 för sitt arbete om stemming och informationsåtervinning.
dbpprop:date
  • December 2007
dbpprop:hasPhotoCollection
dbpprop:reference
dbpprop:wikiPageUsesTemplate
rdfs:comment
  • In linguistic morphology, stemming is the process for reducing inflected (or sometimes derived) words to their stem, base or root form – generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. The algorithm has been a long-standing problem in computer science; the first paper on the subject was published in 1968.
  • Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf Wiki und schrieb auf schreiben. Verschiedene Varianten eines Wortes können z. B. entstanden sein durch: Komposition, Dekomposition, Flexion, Derivation z. B. durch Hinzufügen von Affixen.
  • Stemming es un método para reducir una palabra a su raíz o mejor a un stem o tema. Hay algunos algoritmos de stemming que ayudan en sistemas de recuperación de información. Stemming aumenta el recall que es una medida sobre el número de documentos que se pueden encontrar con una consulta. Por ejemplo una consulta sobre "bibliotecas" también encuentra documentos en los que solo aparezca "bibliotecario" porque el stem de las dos palabras es el mismo ("bibliotec").
  • La lexémisation d'un mot est la fonction qui associe un lexème à celui-ci.
  • Lo stemming è il processo di riduzione della forma flessa di una parola alla sua forma radice, detta tema. Il tema non corrisponde necessariamente alla radice morfologica della parola: normalmente è sufficiente che le parole correlate siano mappate allo stesso tema (ad esempio, che andare, andai, andò mappino al tema and), anche se quest'ultimo non è una valida radice per la parola. La creazione di un algoritmo di stemming è stato un annoso problema dell'informatica.
  • Стемминг — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемминга представляет собой давнюю проблему в области компьютерных наук.
  • En stemmer är ett program eller en algoritm som avgör den morfologiska roten av en bestämd böjd (eller ibland härledd) ordform. Engelska stemmers är tämligen enkla (med bara tidivis problematik som ordet "dries" som är tredje person singularis ordform av verbet "dry" och "axes" som är pluralformen av "ax" precis som "axis") men stemmers blir mer svåra att skapa när morfologin, ortografin och teckenkodningen av språket ifråga blir mer komplext.
rdfs:label
  • Stemming
  • Stemming
  • Stemming
  • Lexémisation
  • Stemming
  • Стемминг
  • Stemmer
owl:sameAs
skos:subject
foaf:homepage
foaf:page
is dbpprop:redirect of