10.3969/j.issn.1000-386X.2012.05.025
WSAM:互联网 UGC 文本主观观点挖掘系统
互联网上的用户生成内容UGC( User Generated Content)中蕴含的用户主观观点信息对分析用户行为、用户需求等工作有着重要的价值.设计一套基于自然语言理解的互联网UGC文本主观观点分析系统WSAM,该系统能挖掘出用户主观观点所蕴含的关注对象和主观成分.分析了互联网UGC现象和生成原因,总结出UGC中用户主观观点中的四种主要类型.挖掘用户主观观点过程中,将用户主观观点的挖掘转化为句子中主观观点关注对象的识别和主观成分的判断.算法结合基于词语类、结构类等相关特征,采用最大熵分类器挖掘用户主观观点.实验验证,WSAM 系统所采用的算法性能较好,且还能够灵活扩充出情感分析(Opinion Mining)等相关应用,同样也能达到较好的结果.
用户生成内容、UGC、自然语言处理、情感分析
29
TP391.1(计算技术、计算机技术)
上海市博士后项目资助10R21421900
2012-07-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
90-94