情感分析不准怎么办?3分钟解决(上)
halo大家好,我是甜甜
这次主要分享如何纠正某些评论数据分析不准的问题
情感分析无论采用 模型训练还是情感词典,都无法保证100%的准确率,一般在70~80%的准确率
但通过”人工调整”可大大提高情感分析的准确率。
主要原因不准的原因:
负面词或正面词提取不准确,会导致情感倾向判断不准
那么微词云情感分析工具中,提供了人工“设置情感词入口”和去除情感词入口,这两大神器几乎可解决98%的问题。
先说下这两个入口怎么用
设置情感词:把你想要提取的情感词和得分输入到这里就行了
例如:小惊喜=1,小瑕疵=-1,太小=-2,小感动=1
输入到这里的词,情感提取与打分时,就会被抽取出来,作为情感判断的依据
移除词:把不需要的情感词去除
例如:小,少,被移除的词,在本次的分析中,将不再作为情感词出现
关于校对分析准确性有两个思路,其中个是,单独对某个句子情感倾向不正确的进行修改
例如我们在负面评论中的这条数据
负面
情感词抽取:[正面词:小心,需要,不错][程度词:很][否定词:不,没]
评论内容:工作人员 非常认真负责,我不小心 丢失了 房卡,酒店 也没需要我 赔付一分钱,房间很不错,下次还来
这里就没有提取出,“认真负责”、“还来” 的正面关键词,当前是酒店行业数据,还来其实是非常正面的词了。
返回第一步,我们在设置情感词中设置,认真负责=1,还来=2,再次分析下看看
我们搜索那句话的关键词“我不小心丢失了房卡”查看下这句话的分析结果如何?已经变成了正面倾向句子
为何这里不选择“负责”这两个字呢?
因为我在【情感分析结果表】中搜索 “负责” 这个词时,发现负责在有的情况不一定是情感词例如
“前台负责接待、负责办理入住,也包含负责”
但实际上并没有情感色彩,然而认真负责、很负责、负责任 是有正面情感色彩的。
所以你也可以把负责这个词移除情感词词库
我们点击第一步,在移除词中,输入负责这个词,再次分析看看
这回在搜索下“负责”这个词,你就会发现情感词中没有“负责”这个词了。
以上是对某个句子进行纠正的办法,下一个方法就是批量处理的,我们下期视频再见。