首页 百科知识 基于凸壳像素比特征的粘连汉字切分

基于凸壳像素比特征的粘连汉字切分

时间:2022-10-17 百科知识 版权反馈
【摘要】:目前,针对粘连字符的切分已经有了一些方法。因此基于背景细化的算法能够在粘连的情况下构造出正确的切分路径。目前,现有的判决方法主要有两种:基于识别的判决方法和基于结构特征的判决方法:基于识别的判别方法引入字符识别器来对切分结果进行正确与否的判断。

6.2 基于凸壳像素比特征的粘连汉字切分

在多字符(包括数字、汉字等)图像中,粘连是指字符间笔划相互接触的情况。在手写体中,字符粘连主要由于手写风格造成的;在印刷体中,则多是由印刷质量造成的。目前,针对粘连字符的切分已经有了一些方法。比如:基于基元合并的算法、基于轮廓特征点构造切分路径的算法、滴水算法、基于骨架形态分析的粘连字符切分方法等等;其中,基于前景/背景细化的方法具有较强的适应性,可以处理注入接触面倾斜、字符间相互重叠等复杂粘连情况。

在此,仅简介魏湘辉等人所采用的基于背景细化的方法。在二值图像中,前景是指所有字符笔划像素,而背景则是指所有非字符像素,通过一些试验人们发现细化后的背景能够提供构造切分路径的有效信息,即细化背景上的特征点往往指向粘连位置,或者构成切分路径中的某一段的起始点或终止点。因此基于背景细化的算法能够在粘连的情况下构造出正确的切分路径。但问题的关键,是如何在一组可能的切分候选路径中选出一条正确的切分路径。目前,现有的判决方法主要有两种:基于识别的判决方法和基于结构特征的判决方法:

(1)基于识别的判别方法引入字符识别器来对切分结果进行正确与否的判断。这种方法的正确率依赖于识别器的性能,所以效率不是很高;

(2)基于结构特征的判别方法则是通过提取与切分路径相关的特征向量,利用训练数据学习得到分类器来对候选路径进行评价。这类方法被普遍采用的原因是代价小,而且除了单独使用,它还可以和基于识别的方法联合以进一步提高切分正确率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈