| 热点推荐 |
|---|
从识别原稿挖掘
在扫描识别不同类型的原稿时,需要用不同的识别处理方法,才能保证得到比较理想的识别效果。如果原稿为报纸或者半透明文稿的话,那么在扫描识别之前要是不采取任何措施的话,报纸背面的文字很容易透过纸张表面来混淆目标文字的字形,从而会对文字的正确识别造成不小的障碍。为此在扫描识别这类文稿时,最好在原稿背面盖上一张黑纸,同时在扫描过程中,将对比度稍微提高一些,这样就能有效降低背面文字对识别效果的干扰程度了。在扫描识别一些印刷质量较差的文稿时,一定要先进行色调调节操作,以确保扫描结果看上去黑白分明,否则的话扫描图象中有可能会出现许多黑色斑点,从而严重影响文字识别的准确率。当然在对色调参数进行调节时,一定注意观察扫描识别界面中的图象预览效果,并根据预览效果对色调进行反复调整,才能得到非常理想的识别结果。在扫描识别图文混排类型的原稿时,应该先确认一下自己选用的扫描识别应用程序能否支持自动图文分析功能,要是可以支持的话,那我们就应该启用该功能,这样扫描识别程序就会自动分析出目标文稿中的文字内容、文本位置等,而文字内容部分只要按照标示顺序来进行正常识别就可以了。
从手工识别挖掘
现在许多文稿排版为了追求尽善尽美的视觉效果,常常会使用图文混排方式,如果我们将原稿简单地扫描成一幅图像的话,将会严重影响文字的识别准确率。有鉴于此,我们应该根据实际情况,对原稿版面进行手工划分,让其版面分为若干个区域;而且应该保证处于同一区域中的文字字号与字体最好相同,尽量没有图像、图形,每一行的文字宽度应该相同,要是发现宽度长短不一的话,最好再进行细分,通常情况下一次最多能扫描识别10个选择区域。此外根据实际情况,我们还需要对多个选择区域设置好识别顺序。大家千万不能嫌这样的操作比较烦,这可是有效提高文字识别准确率的理想途径之一。