In linguistic morphology and information retrieval, stemming is the process for reducing inflected (or sometimes derived) words to their stem, base or root form—generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. Algorithms for stemming have been studied in computer science since 1968.

PropertyValue
dbpedia-owl:abstract
  • Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf Wiki und gesehen auf seh.
  • Stemming es un método para reducir una palabra a su raíz o (en inglés) a un stem o tema. Hay algunos algoritmos de stemming que ayudan en sistemas de recuperación de información. Stemming aumenta el recall que es una medida sobre el número de documentos que se pueden encontrar con una consulta. Por ejemplo una consulta sobre "bibliotecas" también encuentra documentos en los que solo aparezca "bibliotecario" porque el stem de las dos palabras es el mismo ("bibliotec").
  • Lo stemming è il processo di riduzione della forma flessa di una parola alla sua forma radice, detta tema. Il tema non corrisponde necessariamente alla radice morfologica della parola: normalmente è sufficiente che le parole correlate siano mappate allo stesso tema (ad esempio, che andare, andai, andò mappino al tema and), anche se quest'ultimo non è una valida radice per la parola. La creazione di un algoritmo di stemming è stato un annoso problema dell'informatica. Il processo di stemming è utilizzato nei motori di ricerca per l'espansione di interrogazioni e in altri problemi di elaborazione del linguaggio naturale.
  • In linguistic morphology and information retrieval, stemming is the process for reducing inflected (or sometimes derived) words to their stem, base or root form—generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. Algorithms for stemming have been studied in computer science since 1968. Many search engines treat words with the same stem as synonyms as a kind of query broadening, a process called conflation. Stemming programs are commonly referred to as stemming algorithms or stemmers.
  • En stemmer är ett program eller en algoritm som avgör den morfologiska roten av en bestämd böjd (eller ibland härledd) ordform. Engelska stemmers är tämligen enkla (med bara tidivis problematik som ordet "dries" som är tredje person singularis ordform av verbet "dry" och "axes" som är pluralformen av "ax" precis som "axis") men stemmers blir mer svåra att skapa när morfologin, ortografin och teckenkodningen av språket ifråga blir mer komplext. Exempelvis så är en italiensk stemmer mer komplex än en engelsk (beroende på mer potentiella verbböjningar), en rysk stemmer är också mer komplex (beroende på fler kasusböjningar av substantiv), en hebreisk stemmer är ännu mer komplex (beroende på ett vildvuxet skriftspråk) och så vidare. Stemmers är vanliga i frågebaserade system eftersom en användare som söker på ordet "krokodiler" också vill ha dokument som innehåller ordet "krokodil" (utan bokstäverna er). Ett mer komplext förhållningssätt till problemet att avgöra den morfologiska roten till ett ord är lemmatisering. Den första publicerade stemmern någonsin skrevs av Julie Beth Lovins, "Development of a stemming algorithm", Mechanical Translation and Computational Linguistics, 11: 22–31 (1968). Denna artikel var anmärkningsvärd för sin tidiga publicering och hade stort inflytande på senare arbeten med att skapa stemmers. En senare stemmer skrevs av Martin Porter och publicerades i Program, Vol 14 no. 3 pp 130–137, July 1980. Denna stemmer blev vida använd och de-facto standardalgoritm för engelska stemmers. Dr Porter erhöll the Tony Kent Strix Award år 2000 för sitt arbete om stemming och informationsåtervinning.
  • Сте́мматизация (сте́мминг) — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемматизации представляет собой давнюю проблему в области компьютерных наук. Первый документ по этому вопросу был опубликован в 1968 году. Данный процесс применяется в поиcковых системах для обобщения поискового запроса пользователя. Конкретные реализации стемматизации называются алгоритм стемматизации или просто стеммер.
  • La lexémisation d'un mot est la fonction qui associe un lexème à celui-ci.
  • La racinisation (ou désuffixation, ou stemming en anglais) est le nom donné au procédé qui vise à transformer les flexions en leur radical ou stemme. Il cherche à rassembler les différentes variantes flexionnelle et dérivationnelle d’un mot autour d’un stemme. La racine d’un mot correspond à la partie du mot restante une fois que l’on a supprimé son préfixe et son suffixe, à savoir son radical. Elle est aussi parfois connu sous le nom de stemme d’un mot. Contrairement au lemme qui correspond à un mot réel de la langue, la racine ou stemme ne correspond généralement pas à un mot réel. Par exemple, le mot « chercher » a pour radical ou stemme « cherch » qui ne correspond pas à un mot réel. Par contre dans l’exemple de « frontal », le radical ou stemme est « front » qui lui l’est. Les techniques utilisées pour ce faire reposent généralement sur une liste d’affixes (suffixes, préfixes, postfixe, antéfixes) de la langue considérée et sur un ensemble de règles de racinisation/désuffixation construites a priori qui permettent, étant donné un mot de trouver son stemme. Algorithmes pour racinisation ont été étudiés en informatique depuis 1968. Les meilleurs algorithmes connus de racinisation ont été développés par Julie Beth Lovins (1968) et Martin Porter (1980) Et les réalisation d'algorithmes de racilisation sont applés « stemmer » ou «  racinisateur ».
dbpedia-owl:wikiPageExternalLink
dcterms:subject
rdfs:comment
  • Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis auf Wiki und gesehen auf seh.
  • Stemming es un método para reducir una palabra a su raíz o (en inglés) a un stem o tema. Hay algunos algoritmos de stemming que ayudan en sistemas de recuperación de información. Stemming aumenta el recall que es una medida sobre el número de documentos que se pueden encontrar con una consulta. Por ejemplo una consulta sobre "bibliotecas" también encuentra documentos en los que solo aparezca "bibliotecario" porque el stem de las dos palabras es el mismo ("bibliotec").
  • Сте́мматизация (сте́мминг) — это процесс нахождения основы слова для заданного исходного слова. Основа слова необязательно совпадает с морфологическим корнем слова. Алгоритм стемматизации представляет собой давнюю проблему в области компьютерных наук. Первый документ по этому вопросу был опубликован в 1968 году. Данный процесс применяется в поиcковых системах для обобщения поискового запроса пользователя. Конкретные реализации стемматизации называются алгоритм стемматизации или просто стеммер.
  • Lo stemming è il processo di riduzione della forma flessa di una parola alla sua forma radice, detta tema. Il tema non corrisponde necessariamente alla radice morfologica della parola: normalmente è sufficiente che le parole correlate siano mappate allo stesso tema (ad esempio, che andare, andai, andò mappino al tema and), anche se quest'ultimo non è una valida radice per la parola. La creazione di un algoritmo di stemming è stato un annoso problema dell'informatica.
  • En stemmer är ett program eller en algoritm som avgör den morfologiska roten av en bestämd böjd (eller ibland härledd) ordform. Engelska stemmers är tämligen enkla (med bara tidivis problematik som ordet "dries" som är tredje person singularis ordform av verbet "dry" och "axes" som är pluralformen av "ax" precis som "axis") men stemmers blir mer svåra att skapa när morfologin, ortografin och teckenkodningen av språket ifråga blir mer komplext.
  • In linguistic morphology and information retrieval, stemming is the process for reducing inflected (or sometimes derived) words to their stem, base or root form—generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. Algorithms for stemming have been studied in computer science since 1968.
  • La lexémisation d'un mot est la fonction qui associe un lexème à celui-ci.
  • La racinisation (ou désuffixation, ou stemming en anglais) est le nom donné au procédé qui vise à transformer les flexions en leur radical ou stemme. Il cherche à rassembler les différentes variantes flexionnelle et dérivationnelle d’un mot autour d’un stemme. La racine d’un mot correspond à la partie du mot restante une fois que l’on a supprimé son préfixe et son suffixe, à savoir son radical. Elle est aussi parfois connu sous le nom de stemme d’un mot.
rdfs:label
  • Stemming
  • Stemming
  • Lexémisation
  • Stemming
  • Racinisation
  • Stemmer
  • Стемминг
  • Stemming
owl:sameAs
foaf:homepage
foaf:page
is dbpedia-owl:wikiPageRedirects of
is owl:sameAs of
is foaf:primaryTopic of