首页 理论教育 教育数字媒体内容特征提取与检索

教育数字媒体内容特征提取与检索

时间:2022-03-03 理论教育 版权反馈
【摘要】:在教育数字媒体资源注册系统中,分布式教育数字媒体资源的发现主要是基于教育数字媒体内容的相关描述信息,这些描述信息包括学习对象元数据信息和MPEG-7描述信息。因此,需要适当选取若干多媒体特征提取技术应用到教育数字媒体内容的MPEG-7中描述信息自动生成,并根据教育数字媒体资源的特点加以改进。

4.5 教育数字媒体内容特征提取与检索

在教育数字媒体资源注册系统中,分布式教育数字媒体资源的发现主要是基于教育数字媒体内容的相关描述信息,这些描述信息包括学习对象元数据信息和MPEG-7描述信息。学习对象元数据描述信息一般可以通过标准化的教育数字媒体内容制作工具或系统通过人工来进行描述信息的输入,并利用普通的全文检索技术进行这一部分描述信息的检索。但由于MPEG-7标准只定义了多媒体特征描述的方法,底层的很多视觉和听觉特征信息还需要利用图像处理、音频和视频处理等数字媒体处理及其他技术进行自动提取和分析。因此,教育数字媒体内容的特征提取是进行快速、高效检索的基础。

目前,一些基于音频和视频信号与特征分析和模式聚类技术的多媒体内容聚类与自动标注方法不断被提出并被应用于数字媒体内容检索系统中。例如,中科院自动化研究所在“863”计划支持下开发的数字媒体内容管理与检索系统,综合运用了基于元数据标记的音频、视频和文字综合分析聚类与索引技术,可对各类数字媒体内容(特别是动漫素材)进行快捷、高效的检索。浙江大学提出了一种基于压缩域特征话者识别的电视节目分类检索。该方法直接对MPEG的音频信号进行分析,可在一定程度上满足对电视节目实时分析检索的需求。虽然在特征提取方面取得了较大的进步,但由于对多媒体信息的准确理解还十分困难,特别是底层特征与高层语义特征之间的鸿沟,使目前一些数字媒体内容检索系统还未真正满足实际需求。因此,需要适当选取若干多媒体特征提取技术应用到教育数字媒体内容的MPEG-7中描述信息自动生成,并根据教育数字媒体资源的特点加以改进。

考虑到基于知识点的教学和教育资源推送具有许多优点,在教学实践中也备受推崇和应用,因此在教育数字媒体内容的特征描述方法方面应重点考虑提取各种媒体资源的主题信息,有效描述教育数字媒体内容片断涉及的主要知识点信息。这一方面简化和降低了对多媒体内容和特征提取技术的要求,另一方面也适应了教学的实际需要。

针对不同类型的数字媒体内容,应该采用不同的主题信息提取技术。通常文本主题信息提取技术比较成熟,基本过程是对文本数据进行关键词相关信息提取,进行语义分析,进而提取文本数据的主题。但音视频数据的主题信息提取难度较大,一般可采取以下方法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈