期刊专题

10.3969/j.issn.1000-386x.2014.08.048

扩展DPMM模型在短文本主题识别中的应用

引用
近年来,话题检测与追踪(TDT)得到广泛研究.然而,研究主要基于常规的新闻,扩展到短篇报道依然有问题.提出基于耿氏混合模型(DPMM)的话题识别方法,以统一的模型处理话题切分和TDT.介绍DPMM在话题识别中的应用以及讨论两种专门用来解决短篇报道的稀疏问题的方案.一个是算法流程,将话题识别的处理单元由单个短文本转为会话.另一个是扩展DPMM模型,当估算与已知的话题的关联词时考虑字的依赖.随后,通过同时处理话题切分和TDT来识别自发文本流的话题.DPMM模型的优势在于混合组件的数量不必提前确定,并且不需要话题数量与内容的前期准备,因此它更加适合流文本话题识别.实验结果表明,DPMM模型对处理短文本数据的话题识别是有效的.

话题识别、混合模型、扩展耿氏过程、流数据、静态短文本

31

TP311.1(计算技术、计算机技术)

2014-10-09(万方平台首次上网日期,不代表论文的发表时间)

共5页

191-195

相关文献
评论
暂无封面信息
查看本期封面目录

计算机应用与软件

1000-386X

31-1260/TP

31

2014,31(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅