教你轻松玩转“情感分析工具”
halo大家好,我是甜甜!
今天教大家如何玩转微词云情感分析工具,教你玩出花样来~
数据导入与配置
操作流程很简单
第一步:上传需要做情感分析的数据,最好是”评论数据”
这里我上传的是”携程酒店评论”数据,选择一个相关行业,例如酒店
顶部有2个功能,需要大家熟知的
第一个:就是设置”情感词”
例如:情感词提取不准,或关心的情感词提取不出来时,会用到。
解决情感分析不准的问题
你看我这里设置了好多情感词,当然也可以灵活下载情感词数据。
我们在看第二个功能”移除词”
不想显示的情感词,可输入到这里。解决无意义情感词去除问题。
好啦~
点击【下一步】,我们开始情感分析之旅吧!
情感分析报告主要由4款组成
第一块:是统计信息
第二块:是“正负面词”信息和“特征词”信息展示面板
第三块:是情感分析结果表
第四块:是共词网络关系图
基础情感分析统计结果
那么我们一块一块说
首先是统计信息部分;左侧是文本基础信息、包含字数、文本大小、总条数、词汇量
最重要的是分析结果的下载,可以下载打标词表、可以下载特征词表、以及情感分析表
大家可以根据这些表信息进一步做深度分析
中间就是正负面情感趋势占比可视化,鼠标移动上去,可查看正面有多少条数据,负面有多少
最右侧是一个,情感分析散点图,正常的评论数据都是呈正态分布的趋势,若不是,可能有注水倾向
1、左半轴是负面打分与条数据分布情况;
2、中间轴是中性打分与条数据分布情况;
3、右半轴是正面打分与条数据分布情况;
4、我们可以清楚看到平均分数与条数据的平均值,就是这两条蓝线。
这张图反应很多的情感趋势问题,大家可以好好研究下。
情感词和特征词分析表
我们往下滑动,左侧是正面词信息表
可以通过数量、条数据、以及tf-idf来筛选词列表
同时每个情感词都可以点击查看详情,例如点击热情
98%的正面评价,条数据占总量的11%左右,不算低
右侧散点图,是反应情绪与数量分布情况,平均值17分,比总的数据平均值高很多。
往下滑动我们会看到热情相关的网络关系图
这里支持修改配置调整可视化效果,工具灵活度很高
我们把加权次数调低点,方便清楚看出关系强弱
效果一下子就清楚多了,大家在说的是服务热情、前台热情
我们来验证下是否是这样的
在下面搜索下关于服务相关的数据,发现总条数是322条,匹配到253条,占比非常大
我们展开文本看下,第一条说到服务热情、第二条前台小哥服务热情等
同时,我们还可以下载所有展示数据结果。
这里,点击【创建词云】我们可以做两张词云图,一张是正面top100词云图
还可以在负面信息表中点击【创建词云】,制作一张top100负面词云图,做个词云图正负面对比
最右是特征词信息表
这张表就很有意思了,我们重点看下情绪这列信息
点击倒序排列,按照正面数据条数从大到小进行排列
点开正序排列,按照负面数据条数从大到小进行排列
例如我们点击空调这个词看看,发现负面偏多,但占比很小
我们看看下面数据,关于空调负面都说了什么;提到,空调调试很冷、没有冷空调、空调露水、空调不行等
特征词列表,我们可以主要查看“实体词”的情感分析结果,会有意外的分析收获的。
情感分析结果表
好了我们在往下看哈,到了第三个模块,大家肯定很不陌生“情感分析结果表”
具体说下这里怎么用,可以通过正面、负面、中性来搜索评论数据
还可以具体搜索某个关键词,例如卫生
并且你还可以根据: 情感强度、文本长度、情绪词数来过滤评价数据哦
这里我就不多说了,上面提到的比较多
共现网络关系图
我们重点看下共现网络关系图
我们可以选择关心的词,可通过词性选择
也可以直接搜索添加
不想要的词也可以删除,点击单词即可删除
最后点击计算关系就行了
看到这样的可能吓一跳,别怕,我们简单调整下加权次数就行
一下子效果就好很多
解释下这张图这么看
是结合关键词间的共现值生成的网络关系图,其中包含共现次数,共现单词量和总共现值来反应关键词之间的强弱,亲疏关系的
1.节点大小:受共现单词量,以及总共现值来决定,衡量关键词的影响程度,其中节点越大代表共现数,以及总共现值越大
2.关键词线条粗细,衡量关键词间共现次数,次数越大线条越粗,反应关键词强弱关系的指;其中线条越远代表关系越疏远反之越亲密
好了本次说的东西也比较,大家慢慢消化,当然情感分析不可能100%准确,还需要大家人工进行修正数据,来提高准确度。下次再见~