首页 百科知识 凸壳像素比特征与使用

凸壳像素比特征与使用

时间:2022-10-17 百科知识 版权反馈
【摘要】:切分错误时,上下两部分凸壳的面积相差较大;而正确切分时,凸壳的面积相差较小。设S为一个二维点集,S的凸壳是所有包含S的凸集的交,在粘连汉字切分中,S选定为字符图像里所有前景像素点的集合。这一定义同时也对特征进行了归一化。魏湘辉等在200个图像上做了训练,并且对最优切分路径的凸壳像素比特征做了一个统计。统计结果表明:凸壳像素比特征的分布具有很强的规律性,所有的数据都在闭区间[0.4,1.0]内。

6.2.2 凸壳像素比特征与使用

汉字是一种结构化字符,字符中的每一笔画以及每个局部都是整体的有机组成部分。在粘连汉字切分中,错误的切分路径会导致汉字结构的失衡。切分后的字符图像中,一部分会出现冗余的笔画,而另一部分则会有笔画的缺失。

图6.1表明:包罗前景像素的凸壳所含像素的数目,一定程度上反映了结构上的平衡性。切分错误时,上下两部分凸壳的面积相差较大;而正确切分时,凸壳的面积相差较小。

img78

图6.1 汉字切分正确与错误情况下的像素凸壳

设S为一个二维点集,S的凸壳是所有包含S的凸集的交,在粘连汉字切分中,S选定为字符图像里所有前景像素点的集合。

设p1,p2为切分所得的两个字符图像,n1,n2分别为p1,p2前景凸壳所包含的像素数目(包括前景和背景像素);则可定义凸壳像素比特征是:

img79

这里,img80的定义体现了切分后两部分的对等性,即无论较为复杂的字在上或者在下(对横排字符而言是在左或者在右),所计算得到的凸壳像素比基本是是一致的。这一定义同时也对特征进行了归一化

魏湘辉等在200个图像上做了训练,并且对最优切分路径的凸壳像素比特征做了一个统计。统计结果表明:凸壳像素比特征的分布具有很强的规律性,所有的数据都在闭区间[0.4,1.0]内。其中:

147个数据位于闭区间[0.8,1.0]内,占73.5%;

44个数据位于闭区间[0.6,0.8]内,占22%。

由此,魏湘辉等认为:凸壳像素比,大致可以是一个衡量汉字切分是否正确的比较好的评价特征。

据此研究结论,就可利用像素凸壳来较大程度地提升汉字识别的精确度与正确性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈