更新时间:2023-08-15 17:22:02
你们好,最近小艾特发现有诸多的小伙伴们对于字体扫描识别字体样式,字体识别扫描仪这个问题都颇为感兴趣的,今天小活为大家梳理了下,一起往下看看吧。
1、 手稿的准备。为了得到最高的识别率,稿件要平整,没有褶皱,有内容的地方最好没有污渍。将原稿放在玻璃板上时,原稿边缘应与玻璃板边缘平行,不能歪斜。玻璃板应保持清洁,以避免杂物。
2、 选择合适的软件。当然首先要选择好的OCR软件,比如云脉文档识别软件,一般不要用扫描仪自带的OEM软件。OEM的OCR软件功能少,效果差,有的甚至没有中文识别。经过对比,
3、 我选择的是清华TH-OCRMF7.50专业版文字自动识别输入系统。选择另一个图像软件。OCR软件没有扫描界面吗?为什么要找图像软件?第一,OCR软件无法识别所有扫描仪;第二,也是最关键的,
4、 图像软件的扫描界面扫描的图像易于处理;一般选择PHOTOSHOP。
5、 扫描参数设置。对于用于OCR的图像,我的体验是图像类型为黑白,扫描方式为高质量,分辨率为300DPI,缩放为100%,滤镜根据稿件选择。
6、 选择扫描区域。设置好参数后,先进行预览,然后开始选择扫描区域。不要把文章选择在一个区域使用,因为为了追求更好的视觉效果,现在的文章排版更多的是采用图文混排,扫描成一张图片会影响OCR识别。因此,
7、 根据实际情况,布局应分为n个区域。区域怎么划分?各区域文字的字体和字号要一致,不能有图形或图像,每行的宽度要一致。长度不同的情况,要细分。一般来说,一次最多可以扫描10个选区。不要觉得这个过程太烦。
8、 这是提高识别率的有效方法。
9、 保存。保存扫描图像怎么样?实际上,这没什么,只是保存为TIF格式。
10、 OCR软件操作(不同软件可能不同)。打开扫描的图像文件,首先旋转图像,直到文字水平排列。然后进行图像倾斜校正和版面分析。布局分析后,非“水平文本”的部分应设置为“水平文本”。此外,在布局分析之后,
11、 最好再校正一下每块板的倾斜度。最后进行鉴定工作。
12、 编辑。识别后,会出现一个编辑窗口。此时打开汉字输入法,对可疑字忽略识别系统的相似字提示(那样会浪费时间),直接参考参考线(也叫浮动跟踪窗口,在编辑窗口中浮动在当前行的上方或下方,
13、 显示当前行的原始图像信息)。修改完毕,OCR工作结束。
14、 字体的区别。经过多次OCR工作,我发现软件对不同字体会有不同的识别效果,其中对楷书的识别效果最好,其次是仿宋和宋体,对圆体(尤其是细圆体)的识别效果最差。
15、 报纸的扫描识别。由于报纸很薄,大部分纸张不高,扫描仪上的盖板无法完全压住报纸(有缝隙),所以报纸的扫描识别效果一般不如杂志。我的解决办法是在报纸上放一两本16K的杂志,效果还不错。
以上就是字体识别扫描仪这篇文章的一些介绍,希望对大家有所帮助。