基于外卖评论的舆情风控

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 目前许多商家都有线上留言或者评论反馈平台,消费者可以在这些平台上通过留言表达自己对于消费商品的反馈。消费者的反馈包括表扬性的正向反馈,也有一些批评性质的负向反馈。商家需要掌握消费者对于产品的整体舆论取向来判断自己的产品质量是否符合消费者需求,同时了解评论内容可以方便商家分析舆论导向,指导下一步产品研发工作。

业务背景

目前许多商家都有线上留言或者评论反馈平台,消费者可以在这些平台上通过留言表达自己对于消费商品的反馈。消费者的反馈包括表扬性的正向反馈,也有一些批评性质的负向反馈。商家需要掌握消费者对于产品的整体舆论取向来判断自己的产品质量是否符合消费者需求,同时了解评论内容可以方便商家分析舆论导向,指导下一步产品研发工作。

业务痛点

目前许多酒店、餐饮、零售的留言平台每天都有大量的留言产生,传统的舆论情绪收集方案是通过人工统计的方式,但是这种方式较为低效,很难针对大规模的舆论做出精确统计。需要自动化的手段收集并判断留言平台的舆论走向。

解决方案

PAI平台提供了一套基于文本向量化以及分类的算法,可以基于历史标记的正负留言内容生成分类模型,自动对平台上的新增留言进行预测。该服务的整体框架已经基于PAI-Studio开发完成,基于真实的打标后的11987条外卖平台评论数据,实现了自动化的正反面舆论风控,准确性达到75%左右。

1.人力要求:需要具备基础的NLP及分类算法知识用于模型调试

2.开发周期:1-2天

3.数据要求:最好有超过千条的打标数据,数据越多效果越好

数据说明

参数名称 参数描述
label 标签,1是正向评论,0为负面评论
review 实际评论数据

流程说明

进入PAI-Studio产品:https://pai.data.aliyun.com/console

该方案数据和实验环境已经内置于首页模板:

打开实验:

1.数据源

上文提到的评论数据

2.停用词

过滤一些助动词以及标点符号,需要自己上传停用词表

3.文本向量化

利用Doc2vector算法把每个评论变成语意向量,每行是一个向量,每个向量代表一个评论的含义

4.生成分类模型

将向量化后的文本通过拆分算法拆分为训练集以及测试集,训练集通过逻辑回归算法训练生成二分类模型,该模型可以实现对于评论是正向评论或者负向评论的判断。

5.模型效果验证

通过混淆矩阵算法验证模型的实际效果,

总结

本文提到的基于留言评论的舆情风控方案可以用PAI组件在1-2天时间内非常快速的实现,实现后可以批量的对于平台上面的留言舆论进行智能化分析,并且随着数据的累计,模型的准确性会逐渐增强。该方案适用用各种基于文本场景的分析,比如垃圾邮件分类、新闻正反情绪分类等。

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
算法 搜索推荐 小程序
大数据怎么精准获客?营销把广告营销到特殊群体中,进而提升
大数据拓客是将我们采集的消息数据信息筛选,根据服务平台计算、分析,找出规律、勾勒人群画像,再根据大数据营销把广告营销到特殊群体中,进而提升用户转换率
大数据怎么精准获客?营销把广告营销到特殊群体中,进而提升
风控相关
https://www.merchantriskcouncil.org/Pages/home.aspx
496 0
|
人工智能 文字识别 NoSQL
1.为什么要做风控?
目前我们业务有使用到非常多的AI能力,如ocr识别、语音测评等,这些能力往往都比较费钱或者费资源,所以在产品层面也希望我们对用户的能力使用次数做一定的限制,因此风控是必须的!
263 0
1.为什么要做风控?
|
新零售 人工智能 搜索推荐
|
存储 SQL 缓存
京东物流实时风控实践
京东风控数据产品组架构师周文跃,在 FFA 实时风控专场的分享。
京东物流实时风控实践
|
大数据 数据挖掘
去伪存真——用数据分析手游渠道是否作弊
  为什么这个渠道的数据很好,可就是不盈利呢?是我的产品有问题呢?或是渠道作弊?这还真是让人头疼。行业关于渠道作弊这块分享的信息真是太少了,各CP只能跌跌撞撞,靠自己摸着石头过河,那这回我们一起走进数据的世界,用数据说话,拨开迷雾辨真伪吧。
1138 0

热门文章

最新文章