Word error rate (WER) is a common metric of the performance of a speech recognition system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence . The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level.
| Property | Value |
| p:abstract
| - Word error rate (WER) is a common metric of the performance of a speech recognition system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence . The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level. This problem is solved by first aligning the recognized word sequence with the reference word sequence using dynamic string alignment. Word error rate can then be computed as: <math> WER = \frac{S+D+I}{N} </math> where S is the number of substitutions, D is the number of the deletions, I is the number of the insertions, N is the number of words in the reference. When reporting the performance of a speech recognition system, sometimes word recognition rate is used instead: <math> WRR = 1 - WER = \frac{N-S-D-I}{N} = \frac{H-I}{N} </math> where H is N-(S+D), the number of correctly recognised words. (en)
- Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance vocale.Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Au plus le taux est faible au plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions. Après avoir aligné de manière optimale la référence avec le texte reconnu grâce à un algorithme de programmation dynamique, le taux d'erreur de mots est donné par:<math> WER = \frac{S+D+I}{N} </math> Néanmoins, il est fréquent de rapporter plutôt le taux de reconnaissance de mots, ou word recognition rate en anglais, et souvent en pourcentage. Il indique le taux de mots corrects par rapport à un texte de référence. Au plus le taux est élevé, au plus la reconnaissance est de bonne qualité . Le taux minimum n'est pas borné et peut être négatif.<math> WRR = 1 - WER = \frac{N-S-D-I}{N} = \frac{H-I}{N} </math> Où :* <math> N </math> est le nombre de mots de référence,* <math> S </math> est le nombre de substitutions,* <math> D </math> est le nombre de suppressions,* <math> I </math> est le nombre d'insertions (mots ajoutés),* <math> H </math> est le nombre de mots correctement reconnus. (fr)
- WER es una medida comunmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática. Calcula el número mínimo de inserciones, borrados y sustituciones de una palabra por otra, necesarios para transformar una frase en otra. Esta medida se basa en la distancia de edición o de Levensthein, con la salvedad de que esta última se calcula a nivel de letra y WER lo hace a nivel de palabra. En tareas tanto de traducción automática como de reconocimiento del habla, se calcula WER entre la frase generada por el sistema y una frase de referencia correcta. <math> WER = \frac{S+B+I}{N} </math> donde S es el número de sustituciones, B es el número de borrados, I es el número de inserciones, N es el número de palabras que tiene la frase de referencia. Para hallar el valor mínimo de WER entre dos frases se utiliza un algoritmo de programación dinámica. Si consideramos que <math> t_1,t_2...,t_n </math> son las primeras <math> i </math> palabras de la frase generada y <math> r_1,r_2...r_n </math> las <math> r </math> primeras de la frase de referencia: <math> WER= \min \begin{cases} WER+ 1 \\ WER+1 \\ WER+\Delta \end{cases} </math> donde <math>\Delta</math> es 1 si las palabras <math>t_i</math> y <math>r_j</math> son diferentes y 0 si son iguales. Categoría:Lingüística computacional (es)
|
| p:hasPhotoCollection
| |
| rdfs:comment
| - Word error rate (WER) is a common metric of the performance of a speech recognition system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence . The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level. (en)
- Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance vocale.Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. (fr)
- WER es una medida comunmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática. Calcula el número mínimo de inserciones, borrados y sustituciones de una palabra por otra, necesarios para transformar una frase en otra. (es)
|
| rdfs:label
| - Word error rate (en)
- Taux d'erreur de mots (fr)
- Word Error Rate (es)
|
| owl:sameAs
| |
| skos:subject
| |
| foaf:page
| |