单词错误率(Word Error Rate,简称WER)是一种用于评估自动语音识别(ASR)和机器翻译系统性能的指标。它衡量的是识别或翻译结果与参考文本之间的差异程度。具体来说,WER通过计算在将识别或翻译结果转换为参考文本时所需的插入(Insertions)、删除(Deletions)和替换(Substitutions)操作的数量来衡量。
计算公式如下:
WER=(S+D+I)/N×100%
其中:
- S 表示替换的单词数目;
- D 表示删除的单词数目;
- I表示插入的单词数目;
- N 表示参考文本中的单词总数。
WER通常以百分比形式表示,值越低表示识别或翻译的准确性越高。该指标基于Levenshtein距离,即编辑距离的概念,用于衡量两个序列之间的差异
声明:文章来源于网络,如有侵权请联系删除!