基于微博表情符号的情感词典构建研究
基于微博表情符号,提出一种自动构建情感词典的方法.从微博平台抓取大量带有表情符号的微博文本,并依据表情符号对微博文本进行情感倾向标注,生成情感语料库.对语料库进行分词、去重等预处理工作,根据词性规则抽取微博文本中情感词,统计每个情感词在正向和负向语料库中出现的次数,计算情感词的卡方统计值获得情感强度,根据情感词在正负微博文本中出现的概率判定情感词的倾向性,进而生成情感词典.这是一种全新的思路.以人工标注的情感词典为基准数据,实验结果表明,本文方法标注情感词的准确率在80%左右,在情绪词强度阈值θ为20、30时,生成情感词典综合F值最好,达到了82%以上.
表情符号、情感词典、语料库、情感极性
34
TP391(计算技术、计算机技术)
2014-07-29(万方平台首次上网日期,不代表论文的发表时间)
537-541