ROST EA介绍
原ROST虚拟团队出品的ROST系列文本内容挖掘分析平台,是辅助人文社会科学研究的免费计算平台。该软件可以实现文本预处理、分字、分词、词性识别、特殊名词抽取、词频统计、英文词频统计、情感计算、分类算法、聚类算法等一系列文本挖掘,是人文社科研究和论文写作的一把利器。该软件用户量超过一万人,遍布海内外100多所大学,包括剑桥大学、日本北海道大学、北京大学、清华大学、香港城市大学、澳门大学等众多高校。
关于ROSTCM6的安装介绍可以参考之前的文章ROSTCM6软件下载及语义网络分析详细操作教程
ROST EA
情感计算工具。提供了自定义词表,领域情感词表导入、基础情感词表、情感计算、分段情感计算、正面情感、负面情感、中性情感分类计算、汇总、细粒度情感值、异常文本识别、情感分类排行。
安装及使用
网盘链接:https://www.aliyundrive.com/s/GaQVkbfRhMj ,点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看,视频原画倍速播放。
①从阿里云盘中下载后,找到ROST EA文件夹,双击进入
②双击EmotionCalculator.exe源程序,该款软件免安装,双击即可使用。
③ 准备要分析的评论数据,这里我一般是在这个软件的目录创建一个data文件夹,然后将数据放入,这里我以一个水果茶的淘宝评论数据为例。
④将你的评论文本文件编码改成ANSI,否则分析后全是乱码。
打开txt文本文件,看一下右下角你的编码,我的是utf-8,需要更改。
点击菜单栏中的文件,选择另存为
在弹出的页面中,选择ANSI编码,然后点击保存,覆盖原来的就可以
⑤在待分析文本后面打开你上面转码后的文本数据,同时选择领域情感词表(如果有你要分析或相关的领域,直接选取即可,如果没有,直接使用默认的---缺省---也是可以的),这里我选择饮料领域。
⑥如果你要分析特定的关键词,在待分析关键词填写即可。这里我不需要进行关键词分析,所以点右下方的分析即可。
分析完成后会在你文本数据同目录下生成一个跟你数据名一样的文件夹
⑦结果解读
1.左下角的可视化结果似乎用不了,“最”情绪查看可以,在里面你可以看到最积极和最消极的语句得分情况。同时你也可以筛选情感值的范围区间,生成txt文件等。
2.情感分析详细结果文件中,你可以看到每一条评论的情感值、李克特量值、句平均情感值等。
3.情感分段统计结果文件中,你可以看到整个文本数据中积极、中性、消极情绪的占比,以及积极情绪和消极情绪中三个分段的占比情况。
4.正面情感结果文件中,你可以看到所以的正面情感语句的得分情况。
5.负面情感结果文件中,你可以看到所以的负面情感语句的得分情况。
6.中性情感结果文件中,你可以看到所以的中性情感语句的得分情况。
7. 情感分布统计视图文件中,只有各种情绪的占比情况,前面也有。
8.情感细粒度结果文件中,有各句的情感值,总情感值,平均情感值等,目前我也还不是很清楚这个文件怎么使用,后续我学到了再分享给大家。
9.剩下那两个疑似错误语料,我个人觉得是没什么用,摸索了半天也没看出有什么区别,所以大家使用到时候就不必要管这两个文件。(大家有什么新的发现欢迎评论留言分享)