开发者学堂课程【高校精品课-华东师范大学 - Python 数据科学基础与实践:情感分析 下】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/1067/detail/15525
情感分析 下
内容介绍
一、情感分析方法比较
二、情感分析应用领域介绍
一、 情感分析方法比较
1,基于词典的方法
比较一下基于词典的方法。如,have lite,哈工大,台湾大学,词典里的词,有极性和强度的标注,一个词不光是情感,还有极性如正面、负面,有强度,强度的等级。如很好,超好,巨好等等。
方法:识别情感词,识别情感词的极性和强度,用这个识别来做情感分析。如,做的文本分好词以后,再去找这些词是不是情感词典所具有的极性和强度。极性、程度如何,这里面有些极性和强度可能是一些程度副词、否定词。然后再结合一些复杂规则,来注册基于词典的情感分析方法
2,基于机器学习的方法,
前面做过文本分类,其他的课里面应该学过相似性,要进行特定地区,进行量化表示,再应用分类器,分类器分类,然后评估,这样一套流程。
所以真正机器学习,数据挖掘,包括深度学习,如果只从应用角度来说不难。统计专业的有天然优势,像其他专业的学生,像搞信息,搞情报啊,或者其他一些物理,化学的想学,这门纯理论课程。数学统计还是有一定困难的。其他的一些专业就是学起来简单,用起来还是容易的。
3,基于深度学习的方法
好处就是不依赖于特征工程。是自动提取特征。和前面的方法最大的差别的地方在于,前面的方法如果特征做不好的话,后面效果就不好了。有深度学习的话,是自动提取特征,不依赖于特征工程,而且现在用词向量,特别是新的词向量的方法,语言能力非常强大。依赖于深层神经网络的训练。深度神经网络,要通过这个进行训练,而前面学习是传统的机器学习方法--文本分类学习方法,这就是二者不同之处。
二、情感分析应用领域介绍
1,消费者口碑分析
前面提到消费者口碑分析应用是非常重要的,也是情感分析应用最多的地方。消费者也会参考攻略,据此制定自己的购买决策,商家可以据此分析与总结产品和服务的优势和不足,并加以改进以赢得消费者的青睐
2,舆论监控
很多单位,很多政府部门都重视疫情监控啊,像这次疫情的一些舆情分析,由于现在都在上网课,在线课程,花了很多时间,否则的话应该安排,做一下疫情的这个舆情监控,这方面的论文现在外面都需要。讲到舆情监控。再一个是方向一个发生重大是民意实践的
3,事情走向预测
民意分析是挖掘用户的主流观点和态度,要研判事件的未来的走向和发展趋势,主要是重大事件。还有一些,是金融方面的投资的情感分析,比如说国外有投资基金。
通过情感分析研究金融评论文本的情感情绪来构建情绪保护性,来预测金融的走势,而且,这个好像是英国的一个基金,在投资投资的效益不错,年化也可以达到百分之七八以上。美国总统大选就是分析网络舆情重大事件走向。然后,投票人可能会受到影响,调整策略。
4,个人兴趣挖掘
通过社交网络的分析,有社交网络方面的课程。这个也是重大的一个保障,社交网络里面不仅仅是那个文本的,还有意见领袖,还有就是说网络里面的圈子,帮派。
然后,就涉及到挖掘,可以分析个人的偏好兴趣,还可以构造用户画像,是很重要的用户兴趣挖掘。
植入一些简单概念,给概念的一些基本梳理,理论的一个整理。