发布网友 发布时间:2022-04-23 07:46
共2个回答
热心网友 时间:2022-06-17 21:39
OCR (Optical Character Recognition光学字符识别)技术,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
以上是百度百科里的解说。简单来说,OCR就是把书本用扫描方式所得到的图片文件,通过OCR软件(常用的有清华紫光,尚书,汉王,丹青等等),转换成文字形式的技术。
用在哪里呢?比如说,很多以前的书籍没有电子档,用打字保留下来太累了,又想转成电子档,这时就要用先扫描下来,然后用OCR把它们转成文字 。
当然,OCR技术也是有局限性的,不是标准印刷体它就认不了了,手写体肯定不认,比较偏门的字体也认不出来。一般对宋体、黑体、楷体、幼圆、隶书等系统默认字体的辨识度比较高,你整个行楷彩云啥的给它识别出来的结果就不怎么理想了。
参考资料:http://ke.baidu.com/view/17761.htm
热心网友 时间:2022-06-17 21:39
OCR技术是光学字符识别的缩写(Optical Character Recognition),是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。简单地说,就是识别文字图片,提取文字内容,比如云脉OCR文档识别技术,便是基于成熟的OCR技术,将图片上的文字进行识别,提取成文本文,保存后还可开启进行编辑,并且可导出word和pdf格式,识别率高,字符识别率高于97%。