| dbpprop:abstract
|
- A conditional random field (CRF) is a type of discriminative probabilistic model most often used for the labeling or parsing of sequential data, such as natural language text or biological sequences.
- Ein Conditional Random Field (CRF) ist ein ungerichtetes graphisches Modell. Oft werden CRFs zum Taggen von sequentiellen Daten verwendet. Das bedeutet, das CRF erhält eine Sequenz X als Eingabe und gibt eine gleichlange Sequenz Y aus. Im Unterschied zu Hidden-Markov-Modellen (HMMs; ein anderes, jedoch gerichtetes Modell für sequentielle Daten), kann ein CRF an jeder Stelle auf die komplette Information der Eingabesequenz zugreifen wohingegen ein HMM nur die aktuelle Eingabe sieht.
- Un campo aleatorio condicional (Conditional Random Field o CRF en inglés) es un modelo estocástico utilizado habitualmente para etiquetar y segmentar secuencias de datos o extraer información de documentos. En algunos contextos también se les denomina campos aleatorios de Márkov . Dada una secuencia de datos <math>O_1,... O_N</math> este modelo asigna una etiqueta <math>S_i</math> para cada elemento <math>O_i</math>. Aunque presenta similitudes con los modelos ocultos de Márkov, estos son modelos generativos que modelan connjuntamente la distribución de probabilidad de las etiquetas (o estados) y las observaciones, <math>P(S,O)</math>, mientras que los campos aleatorios condicionales modelan la probabilidad de la secuencia correcta de etiquetas condicionada por las observaciones, <math>P(S|O)</math>, es decir, son modelos discriminativos. Se puede representar con un grafo no dirigido <math> G = (V, E) \, </math> en el que cada vértice represente una variable aleatoria cuya distribución de probabilidad debe ser deducida, y cada arista indique una dependencia entre las variables de los vértices que conecta. El grafo obedece la propiedad de Márkov extendía a grafos: <math>P(S_i|O, S_j; i \neq j) = P(S_i|O, S_j; S_i \sim S_j)</math> donde <math>\sim</math> significa que los vértices <math>S_i</math> y <math>S_j</math> están conectados por una arista. En cuanto a los datos <math>O_i</math>, también llamados observaciones, lo más frecuente es que sean también una secuencia. Además, es frecuente que cada <math>O_i</math> sea un vector, no un valor escalar, en cuyo caso tendríamos observaciones multimensionales. El grafo puede tener una estructura arbitrariamente compleja, aunque lo más común es que sea una cadena o un "rejilla". En una cadena, cada vértice está únicamente conectado con el vértice predecesor y con sus sucesor (se asume que los vértices están ordenados). En una rejilla, cada vértice está conectado con otros 4, excepto en los extremos; un vértice <math>S_{ij}</math> estará conectado con <math>S_{i,j-1},S_{i,j+1},S_{i-1,j}</math> y <math>S_{i+1,j}</math>. En el caso de la cadena la propiedad de Márkov puede reescribirse de la siguiente forma: <math>P(S_i|O, S_j; i \neq j) = P(S_i|O, S_j; S_{i-1},S_{i+1})</math>
- 条件随机场(conditional random field,簡稱 CRF),是一種鑑別式機率模型,是随机场的一种,常用於標注或分析序列資料,如自然語言文字或是生物序列。 如同马尔可夫随机场,條件隨機場為無向性之圖模型,圖中的頂點代表隨機變數,頂點間的連線代表隨機變數間的相依關係,在條件隨機場當中,隨機變數 Y 的分佈為條件機率,給定的觀察值則為隨機變數 X。原則上,條件隨機場的圖模型佈局是可以任意給定的,一般常用的佈局是鏈結式的架構,鏈結式架構不論在訓練(training)、推論(inference)、或是解碼(decoding)上,都存在有效率的演算法可供演算。 條件隨機場跟隱藏式馬可夫模型常被一起提及,條件隨機場對於輸入和輸出的機率分佈,沒有如隱藏式馬可夫模型那般強烈的假設存在。
|