10.16353/j.cnki.1000-7490.2015.11.021
基于主题关联挖掘的跨类型数字资源分类方法
针对当前跨类型数字资源自动分类研究中未充分利用不同类型数字资源特征之间的潜在语义关联以及无法解决跨类型数字资源分类过程中的维度灾难和特征稀疏等问题,提出一种基于主题相关性挖掘的跨类型数字资源分类方法.通过TG-LDA模型对数字资源进行语义建模,并结合开放知识库Wikipedia对建模后的共享主题空间进行语义概念的扩展,最后通过MaxEnt、SVM等多种算法实现对数字资源的跨类型分类.实验表明,该方法能有效增强不同类型数字资源间的亲和性,提高不同类型数字资源间的分类性能.
数字资源、主题挖掘、跨类型分类、分类方法
38
本文为国家自然科学基金项目"基于社会网络的协作模型及推荐技术研究"的成果,项目编号:71102111.
2015-11-26(万方平台首次上网日期,不代表论文的发表时间)
108-114