In computational linguistics, a frequency list is a sorted list of words (word types) together with their frequency, where frequency here usually means the number of occurrences in a given corpus. A short example could be:

PropertyValue
p:abstract
  • In computational linguistics, a frequency list is a sorted list of words (word types) together with their frequency, where frequency here usually means the number of occurrences in a given corpus. A short example could be: the3789654 he 2098762 [...] king 57897 boy 56975 [...] outragious 76 [...] stringyfy 5 [...] transducionalify 1 It seems that Zipf's law holds for frequency lists drawn from longer texts of any natural language. Frequency lists are a necessary prerequisite for building of an electronic dictionary, which is by itself a prerequisite for a wide range of applications in computational linguistics. German linguists define the häufigkeitsklasse (frequency class) of an item in the list using the base 2 logarithm of the ratio between its frequency and the frequency of the most frequent item. The most common item belongs to frequency class 0 (zero) and any item that is half as frequent belongs in class 1. In the example list above, the misspelled word outragious has a ratio of 76/3789654 and belongs in class 16. :N=0.5-\log_2\left(\frac{\text{Frequency of this item}}{\text{Frequency of most common item}}\right) (en)
  • Der Begriff Häufigkeitsklasse ist ein Begriff aus der Linguistik und ist ein statistisches Maß für die Häufigkeit eines Wortes in einer natürlichen Sprache. Zur Berechnung der Häufigkeitsklasse wird das Zipfsche Gesetz verwendet, das als Sprachgesetz eine besondere Bedeutung in der Quantitativen Linguistik hat. (de)
  • Частотный словарь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), по типичности (слова, частотные для большинства текстов), и т. д. Частотные списки используются для преподавания языка, создания новых словарей, приложений компьютерной лингвистики, исследований в области лингвистической типологии, и т. д. (ru)
p:hasPhotoCollection
p:wikipage-de
p:wikipage-ru
rdfs:comment
  • In computational linguistics, a frequency list is a sorted list of words (word types) together with their frequency, where frequency here usually means the number of occurrences in a given corpus. A short example could be: (en)
  • Der Begriff Häufigkeitsklasse ist ein Begriff aus der Linguistik und ist ein statistisches Maß für die Häufigkeit eines Wortes in einer natürlichen Sprache. Zur Berechnung der Häufigkeitsklasse wird das Zipfsche Gesetz verwendet, das als Sprachgesetz eine besondere Bedeutung in der Quantitativen Linguistik hat. (de)
  • Частотный словарь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. (ru)
rdfs:label
  • Frequency list (en)
  • Häufigkeitsklasse (de)
  • Частотный словарь (ru)
skos:subject
foaf:page