开发者学堂课程【高校精品课-华东师范大学 - Python 数据科学基础与实践:情感分析 上】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/1067/detail/15524
情感分析 上
内容介绍
一、情感分析的定义
二、情感分析构成
三、情感分析详情
左图跟文本分类一样
情感分析有多种定义,但都大同小异本章情感分析的定义为。
一、情感分析的定义
情感分析是对文本进行上下文挖掘,识别和提取文本中的主观信息(积极、消极和中性),中性一般不考虑
文本分析的目的,帮助企业了解其品牌、产品或服务的用户情感。
情感分析又可以称为:观点挖掘、倾向性分析、意见抽取、意见挖掘、情感挖掘、主观分析;Sentiment analysis/Opinion mining
是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程
二、情感分析构成
-观点持有者 发表观点、情感,分析不同用户的情感,
-评价对象
-评价观点
-评价文本,大多数时只考虑评价文本,只考虑文本是积极与否,一般比较简单。详细一点,应该是区分不同的观点持有者。哪些用户什么观点,然后,再进一步,要在文本里分析出,评价对象,评价观点。里面有评价对象和评价观点,评价对象和评价词,主观力度强。
在大作业里,不一定是叫情感分析,可以是观点挖掘,在民生的文本里挖掘观点,观点可以是,表达的是地方的交通特别堵,或医疗药费特别贵,在民生里挖掘力度细
三、情感分析详情
1,情感粒度
二元分类的粒度是把情感分成正面负面,积极消极,感兴趣,不感兴趣等等二元分类
三元分类,比如增加一个中性
多元分类,如七情六欲。七情,喜怒忧思悲恐惊。在文本里分析多情绪、多标签的情感。或者以一星到五星打分进行多标签的多元分类。
情感分析的粒度指情感本身的粒度情感
2,文本粒度
篇章级,粗---篇章的情感。句子级,细---句子的情感。方面级aspect,到某一特征 某一评价对象情感。
现在情感分析的发展趋势,已经是到细粒度。通过情感分析。例如,雅戈尔的衬衫比七匹狼好,为什么雅戈尔的衬衫比七匹狼好,实际上这在商业里面是没有意义,只是知道好坏。进一步希望知道什么呢?知道雅戈尔的衬衫到底在哪几个方面好,面料,做工还是价格等等。所以方面级可以再进一步分成粗粒度和细粒度。主要就是看分析的对象,文本级别是粗粒度和细粒度。
3,分析方法
情感分析的方法跟文本分类放在一起讲,所以现在,目前用的最成熟的还是分类的基础,此外还有,基于情感词典的方法,指是分类技术,基于词表的方法看看情感词表里,在文本里面中的词是不是情感词表这样一个概念情感分析
开始流行起来以后---机器学习的方法
深度学习在大的范畴里面也是机器学习,但其特征自动提取,主要是特征的自动提取特征。不要人工干预情感分析的方法
4,研究方向
目前情感分析的研究方向,有情感分类,还有可以打分的情感评分,就是结合情感分类,然后进行强度打分。可以做专门做评价对象抽取。评价词抽取。
注意:之前往往是把情感分析的观点。观念放在一起Sentiment analysis/Opinion mining放一起。所以,要在里面抽取的评价对象和评价词。
课程是永远是要结束,探索是无尽的,所以在大作业里,看那个组能不能做得到,里面做的民生关注做得更细,能够真的是挖掘到文本里面的用户的关注,所以,评价对象,评价词的抽取。另外还可以做一些概括性的,也就是之前的评价对象,评价词也许抽出来了,当然抽出来以后,也不知道那两个是不是一对一对的。因为,如果用命名实体识别,这样一个条件随机场,用命名实体识别的方法只出来一个独立词,可以后面通过规则,在一段话里面看两个对象之间的关系,结合具法分析吧,能不能判断是一对,就是讲的观点概括,评价对象,评价值正确的,然后在做各种统计分析。然后还可以做一些虚假评论的设备设备如一些水军
5,应用领域
前面的文本分类有了很多应用领域,情感分析也有很多应用领域,现在商业领域里面用的最多的应用领域就是消费者口碑分析。然后是事件的走向预测。接下来是舆情监控,用户兴趣挖掘,后面会展开介绍。当然还有很多应用领域。民生关注,就是这样的应用领域