首页 百科知识 基于背景细化的切分方法

基于背景细化的切分方法

时间:2022-10-17 百科知识 版权反馈
【摘要】:在上述的四个步骤中的,前三个都不是在此予以讨论的重点,而其重点应是如何提取有效的特征,这对基于结构特征的最优路径判决方法至关重要。路径上的前景像素的数目与待切分高度的比值,路径上点的平均角度等。因此,如果能提出一种有效地反映切分对汉字结构影响的特征,将会改善对候选切分路径的选择,提高切分正确率。

6.2.1 基于背景细化的切分方法

如上所述,将背景看为所有非字符像素。它主要有四个步骤:

(1)细化背景。

(2)在细化后的背景上提取特征点(包括叉点、端点和角点)。

(3)构造候选切分路径,即通过搜索来连接背景上的一些特征点,构成从图像的顶部延伸到底部(对竖排字符而言是从左侧延伸到右侧)的所有路径。

(4)对候选路径进行评价,选择最优切分路径。

在上述的四个步骤中的,前三个都不是在此予以讨论的重点,而其重点应是如何提取有效的特征,这对基于结构特征的最优路径判决方法至关重要。现有的特征,大致可以分为以下三类:

(1)根据切分结果的相互关系定义特征。比如粘连字符左右两部分的像素数目比、高度比和宽度比等,两个粘连字符所在的矩形重叠部分与切分后较窄部分的宽度比(对竖排字符而言是高度比)。

(2)路径特征。路径上的前景像素的数目与待切分高度(对竖排字符而言是宽度)的比值,路径上点的平均角度等。

(3)根据切分结果单独定义的特征。例如每一切分结果的宽高比。

在上述的三个特征中,第(1)类中的某些特征和第(3)类特征反映切分错误对汉字结构的影响,例如:第(1)类中的像素数目比、高度比、宽度比,第(3)类中的宽高比。然而,当粘连的两个汉字笔画数相差较多,或由于书写风格而造成汉字字形变化较大的时候,基于和这些特征的分类器都将难以判断出最优切分路径。因此,如果能提出一种有效地反映切分对汉字结构影响的特征,将会改善对候选切分路径的选择,提高切分正确率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈