TEA的简介
文本情感分析:又称意见挖掘、倾向性分析等。简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。互联网(如博客和论坛以及社会服务网络如大众点评)上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。
TEA的应用
自然语言处理的一个关键问题:判断一句评价/点评/影评的正/负倾向性。
1、如何判断?
T1、类别输出:输出一段文本之后的正、负类别
T2、得分输出:输出一段文本之后的分数值(0~1分值)
2、应用
电子商务应用:用户关于购物产品的质量体验(淘宝、亚马逊、Netflix、腾讯视频)
市场呼声应用:根据用户反馈分析竞争对手的弱点,帮助企业制定新的营销策略(Radiant6,Sysomos, Lexalytics)
政府选举应用:分析对手党派的弱点,进行针对性措施(美国总统选举)
消费者呼声应用:个性化用户反馈分析
可视化分析应用:积极/消极词汇可视化
TEA的实现流程
有很多开源软件使用机器学习、统计、自然语言处理的技术来计算大型文本集的情感分析, 这些大型文本集合包括网页、网络新闻、网上讨论群、网络评论、博客和社交媒介。
1、情感分析架构流程
TEA的实现方法
T1、词袋模型
The Bag of Words Representation,是一种基于频率统计的方法。
1、向量空间模型 Vector Space Model
(1)、分词:比如,我非常喜欢《肖申克的救赎》一>我/非常/喜欢/肖申克的救赎
(2)、思路:忽略文章/评论中词语的顺序,每个词对应空间中一个单位向量,文章/评论是词语的加权总和。
2、词袋模型的应用
情感分析
文章主题分类
垃圾邮件过滤
图像分类
TEA的案例应用
1、基于朴素贝叶斯的情感分类器
文章推荐
NLP之TEA:基于SnowNLP实现自然语言处理之对输入文本进行情感分析(分词→词性标注→情感分析→测试)
https://blog.csdn.net/qq_41185868/article/details/87554490