中文名:光学字符识别
外文名:OCR
全 称:Optical Character Recognition
识别好坏指标
拒识率、误识率、识别速度等
决定因素
A.图片的质量,一般建议150dpi以上
B.颜色,一般对彩色识别很差,黑白的图片较高,因此建议ocr的为黑白tif格式
C.最重要的就是字体,如果是手写识别率很低。
国内OCR识别简体差错率为万分之三,如果要求更高的精度需要投入更大的人工干预。繁体识别由于繁体字库的不统一性(民国时期的字库和现在繁体字库不统一),导致识别困难,在人工干预下,精度能达到90%以上(图文清晰情况下)。