什么是OCR字符识别

发布网友发布时间：2022-04-23 07:46

共2个回答

热心网友时间：2022-06-17 21:39

OCR （Optical Character Recognition光学字符识别）技术，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。

以上是百度百科里的解说。简单来说，OCR就是把书本用扫描方式所得到的图片文件，通过OCR软件（常用的有清华紫光，尚书，汉王，丹青等等），转换成文字形式的技术。
用在哪里呢？比如说，很多以前的书籍没有电子档，用打字保留下来太累了，又想转成电子档，这时就要用先扫描下来，然后用OCR把它们转成文字。
当然，OCR技术也是有局限性的，不是标准印刷体它就认不了了，手写体肯定不认，比较偏门的字体也认不出来。一般对宋体、黑体、楷体、幼圆、隶书等系统默认字体的辨识度比较高，你整个行楷彩云啥的给它识别出来的结果就不怎么理想了。

参考资料：http://ke.baidu.com/view/17761.htm

热心网友时间：2022-06-17 21:39

OCR技术是光学字符识别的缩写(Optical Character Recognition)，是针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。简单地说，就是识别文字图片，提取文字内容，比如云脉OCR文档识别技术，便是基于成熟的OCR技术，将图片上的文字进行识别，提取成文本文，保存后还可开启进行编辑，并且可导出word和pdf格式，识别率高，字符识别率高于97%。

全部栏目

什么是OCR字符识别