聚类分析工具怎么用?
最近微词云上线了聚类分析可视化工具,很多小伙伴在咨询这么用
当前版本是需要人工聚类数据的,未来会增加更多系统聚类分析方法,具体说下如何使用以及优化效果图
工具体验地址:https://fenci.weiciyun.com/cn/cluster/
聚类数据表怎么来?
聚类分析工具中只要求上传2个数据表就行,第一个数据表数共词矩阵表,第二个数据表数聚类表
关于矩阵表大家估计都知道怎么使用,在中文分词工具中就可以下载矩阵表的,可具体查看中文分词下的教程视频,这里就不再重复
第二个表聚类表,是需要我们自己手动分类关键词了
我们先下载聚类表案例图
我们会看到两列数据,第一列是关键词,第二列是类别
C0的所有关键词是相同类别数据,C1的所有关键词是相同类别数据,这里的C0、C1、C2、C3、C4、C5、C6都会不同类别数据,可以理解为聚了7类数据。
看懂案例聚类表,我们就知道如何自己手动分类关键词了
首先我们先把共词表中,竖列的单词全部复制下来放在案例表中,(提前把案例数据清空)。
请注意,聚类表的关键词要与共词矩阵表的关键词完全一致;
我们要给单词分“类别”,例如你认为,序号2、3、4、5、6是同一类别数据,那么你就在类别那一列标注上C0
例如序列号9、10、12、15是一类你就标注为C1,其他的以此类推
我们可以手动聚2类、3类、5类都可以,不建议聚类太多,给每个单词标注好合适的类别,并保存为excel格式就行
接下来你就开始上传矩阵表和聚类表就可以生成数据了
如何调整优化聚类效果图?
上传完数据并点击「计算并生成」后,系统默认生成聚类可视化,但多多少少效果总是不尽人意
我们可以点击右侧顶部的「配置主题」来调整聚类效果图
例如我们发现很多关键词节点重叠在一起了,我们可以增加加权值来改善效果,并点击底部「渲染」按钮,查看效果。可多次调整数据值,来优化效果
如果想降低一些关系连线,让关系效果看起来更直观,可以通过降低线条的数量来调节
统一“类别”的关键词,节点颜色是一样的,如果对颜色不满意,可以修改类型颜色。
本次教程就说到这里,如果疑问请联系我们的人工客服。