【数据对比】综合分析百度情感分析以及华为情感分析的差异,我有了如下结果

简介: 【数据对比】综合分析百度情感分析以及华为情感分析的差异,我有了如下结果

前言


某一天,经理找到我,说BOSS需要情感分析对比的结果,我这边能不能研究一下几家情感分析的平台,按照(巴拉巴拉)的要求进行分析,于是就有了这篇文章......


为什么要进行对比


  1. 公司任务
  2. 了解下情感分析
  3. 对比几家情感分析


业务场景:


用提供的截取微博网上留言信息,调用华为云的情感分析,百度云情感分析(通用接口),百度云情感分析(定制化模型,自定义学习资料)。根据以下几个点进行对比。

  • 未处理的原版数据
  • 通用模型-       原版分类置信度
  • 定制模型 -  原版分类置信度     (800条学习资料样本,     85.96%准确率的学习资料)
  • 定制模型 -  原版分类置信度     (1800条学习资料样本,     65.93%准确率的学习资料)
  • 原版评论分类置信度     (华为云 仅2000条左右数据)
  • 通用模型-       原版评论负面倾向概率
  • 定制模型  - 原版评论负面倾向概率     (800条学习资料样本,     85.96%准确率的学习资料)
  • 定制模型  - 原版评论负面倾向概率     (1800条学习资料样本,     65.93%准确率的学习资料)
  • 通用模型-       原版评论正面倾向概率
  • 使用定制模型  -      原版评论正面倾向概率     (800条学习资料样本,     85.96%准确率的学习资料)
  • 使用定制模型  -      原版评论正面倾向概率     (1800条学习资料样本,     65.93%准确率的学习资料)
  • 通用模型-  原     版评论分析正负结果值
  • 定制模型 -       原版评论分析正负结果值      (800条学习资料样本,     85.96%准确率的学习资料)
  • 定制模型 -       原版评论分析正负结果值      (1800条学习资料样本,     65.93%准确率的学习资料)
  • 原版评论正负结果值     (华为云 仅2000条左右数据)
  • 处理掉@和#后的评论数据:
  • 通用模型-       原版分类置信度
  • 定制模型 -  原版分类置信度     (800条学习资料样本,     85.96%准确率的学习资料)
  • 定制模型 -  原版分类置信度     (1800条学习资料样本,     65.93%准确率的学习资料)
  • 原版评论分类置信度     (华为云 仅2000条左右数据)
  • 通用模型-       原版评论负面倾向概率
  • 定制模型  - 原版评论负面倾向概率     (800条学习资料样本,     85.96%准确率的学习资料)
  • 定制模型  - 原版评论负面倾向概率     (1800条学习资料样本,     65.93%准确率的学习资料)
  • 通用模型-       原版评论正面倾向概率
  • 使用定制模型  -      原版评论正面倾向概率     (800条学习资料样本,     85.96%准确率的学习资料)
  • 使用定制模型  -      原版评论正面倾向概率     (1800条学习资料样本,     65.93%准确率的学习资料)
  • 通用模型-  原     版评论分析正负结果值
  • 定制模型 -       原版评论分析正负结果值      (800条学习资料样本,     85.96%准确率的学习资料)
  • 定制模型 -       原版评论分析正负结果值      (1800条学习资料样本,     65.93%准确率的学习资料)
  • 原版评论正负结果值     (华为云 仅2000条左右数据)


解决的问题:


  1. 对比了两家的情感分析之后,经过综合分析,百度云情感分析(通用模型)的准确率是最高的。
  2. 目前综合来看,百度云的情感分析通用模式是自然语言分析的最好选择。
  3. 定制化的百度模型实际测试不如通用模型准确(可能为学习模型数据不够准确)。


挑战:


  1. 首次使用华为云情感分析,对于接口调用方面自己阅读文档不够详细,走了较多的弯路,不过经过仔细研究自行解决。
  2. 由于存在QPS限制,调用的时候需要限制调用频率。
  3. 由于网络原因可能存在频繁调用的情况。
  4. 数据较多的情况下处理数据的时长比较久(针对试用而言)。
  5. 根据不同的定制化模型。
  6. 可能存在无法分析的特殊字符数据。


使用服务:


自然语言处理 - 情感分析


如何解决:


1. 在不超过**qps**限制的情况下,试用分页形式,分段请求,在数据库中设置 判断值判断数据是否进行分析,如果重复调用会直接过滤掉已经进行情感分析的数据。
   2. 对于线程进行`休眠`操作,防止调用请求过于频繁接口调用失败。
   3. 使用日志记录失败请求信息,失败请求原因,失败请求数据。
   4. 多次调用数据确保大部分数据可以产生结果,个别数据请求失败以及没有数据的忽略。
复制代码


使用场景:


  1. 比对市面上几家华为云的情感分析使用,根据分析结果数据进行比对。
  2. 对比百度云通用模型和定制化模型的使用。
  3. 对比不同的环境下分析的数据,数据差异值。


方案截图:


网络异常,图片无法展示
|


(处理掉特殊字符前的截图)


网络异常,图片无法展示
|


(处理掉特殊字符后的截图)


使用规模:


共1000条数据左右。(其实总共有18000条数据)


使用收益:


  1. 单单从纸面数据来看,可能百度的稍好一些
  2. 最后BOSS让我用的百度云的情感分析
  3. 很好奇情感分析的原理


结语


原数据报表有 18000条,如果有对情感分析感兴趣,或者想要了解情感分析对比结果的,可以留言邮箱,我会抽空把报表数据发送至您的邮箱

如果觉得对您有帮助欢迎扩散

相关文章
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
构建AI智能体:九十、图解大模型核心三大件 — 输入编码、注意力机制与前馈网络层
本文深入解析了大模型三大核心技术:输入编码、多头自注意力机制和前馈网络层,从应用视角阐述了它们的工作原理和协同效应。输入编码负责将文本转换为富含语义和位置信息的数学表示;多头自注意力机制通过多专家团队模式建立全局依赖关系,解决长距离依赖问题;前馈网络层则通过非线性变换进行深度语义消歧。文章通过可视化示例展示了词向量的语义关系建模、注意力权重的分布模式以及前馈网络的语义过滤功能,形象地说明了大模型如何通过这三层架构实现"广泛联系-深度加工"的认知过程。
277 5
|
网络协议 网络安全 网络虚拟化
|
3月前
|
数据采集 人工智能 自然语言处理
为企业打造AI智能客服系统全流程
AI智能客服建设需遵循“需求锚定—基础搭建—落地优化”六步法:需求调研、数据资产化、模型选型、训练优化、内测验证、运营迭代。兼顾企业规模差异,强调聚焦高频场景、重视知识库质量、规避盲目追新,助力高效落地、避免效果不达预期。(239字)
|
机器学习/深度学习 人工智能 程序员
阿里云出手DeepSeek拒绝服务器繁忙,程序员直呼:真香!
阿里云PAI平台支持一键部署DeepSeek-V3和DeepSeek-R1大模型,用户无需编写代码即可完成从训练到部署的全过程。通过PAI Model Gallery,开发者可轻松选择并部署所需模型版本,享受高效、便捷的AI开发体验。教程详细介绍了开通PAI、选择模型及一键部署的具体步骤,帮助用户快速上手。
|
机器学习/深度学习 存储 人工智能
《DeepSeek情感分析技术:突破与创新,精准判断情感倾向》
在数字化时代,文本数据激增,情感分析成为关键需求。DeepSeek作为AI领域的佼佼者,基于Transformer架构实现深度语义理解,通过多模态融合技术全面感知情感,结合领域自适应与迁移学习跨越不同场景,采用对抗训练提升鲁棒性,并融合情感词典与知识图谱增强理解。这些创新使DeepSeek能精准判断情感倾向,为企业和研究提供有力支持。
1575 20
|
人工智能 编解码
ReCamMaster:视频运镜AI革命!单镜头秒变多机位,AI重渲染颠覆创作
ReCamMaster 是由浙江大学与快手科技联合推出的视频重渲染框架,能够根据用户指定的相机轨迹重新生成视频内容,广泛应用于视频创作、后期制作、教育等领域,提升创作自由度和质量。
969 0
|
传感器 机器学习/深度学习 数据采集
2022年第十一届认证杯数学中国数学建模国际赛小美赛:C 题 对人类活动进行分类 建模方案及代码实现
本文提供了2022年第十一届认证杯数学中国数学建模国际赛小美赛C题"对人类活动进行分类"的建模方案和Python代码实现,包括数据预处理、特征提取、LSTM网络模型构建和训练评估过程。
496 11
2022年第十一届认证杯数学中国数学建模国际赛小美赛:C 题 对人类活动进行分类 建模方案及代码实现
|
机器学习/深度学习 人工智能 监控
阿里通义开源全模态大语言模型 R1-Omni:情感分析成绩新标杆!推理过程全程透明,准确率飙升200%
R1-Omni 是阿里通义开源的全模态大语言模型,专注于情感识别任务,结合视觉和音频信息,提供可解释的推理过程,显著提升情感识别的准确性和泛化能力。
1663 10
阿里通义开源全模态大语言模型 R1-Omni:情感分析成绩新标杆!推理过程全程透明,准确率飙升200%
|
JavaScript 前端开发 调度
async/await和Generators的底层实现原理有什么不同?
总体而言,async/await 和 Generators 虽然都用于处理异步操作,但它们的底层实现原理有着不同的侧重点和方式。理解这些差异有助于我们更好地运用它们,并在不同的场景中选择合适的方式来处理异步编程。
308 63
|
存储 人工智能 自然语言处理
Lindorm作为AI搜索基础设施,助力Kimi智能助手升级搜索体验
月之暗面旗下的Kimi智能助手在PC网页、手机APP、小程序等全平台的月度活跃用户已超过3600万。Kimi发布一年多以来不断进化,在搜索场景推出的探索版引入了搜索意图增强、信源分析和链式思考等三大推理能力,可以帮助用户解决更复杂的搜索、调研问题。 Lindorm作为一站式数据平台,覆盖数据处理全链路,集成了离线批处理、在线分析、AI推理、融合检索(正排、倒排、全文、向量......)等多项服务,支持Kimi快速构建AI搜索基础设施,显著提升检索效果,并有效应对业务快速发展带来的数据规模膨胀和成本增长。