Salesforce 用机器学习来自动总结文本,AI+SaaS 是未来吗?

简介:

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如, Salesforce 的 AI 新产品 Einstein 会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型( new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。 MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是 Salesforce 去年收购的深度学习创企 MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce 加入人工智能的军备竞赛,彼时它收购了 iOS 平台第三方智能日历应用 Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除 MetaMind 外,Salesforce 还收购开源机器学习服务商 PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品 Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP 近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

Salesforce 在变得更“聪明”的道路上又进了一步。

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如,Salesforce 的 AI 新产品 Einstein会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型(new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是Salesforce 去年收购的深度学习创企MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce加入人工智能的军备竞赛,彼时它收购了iOS平台第三方智能日历应用Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除MetaMind 外,Salesforce 还收购开源机器学习服务商PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
9月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
1407 109
|
机器学习/深度学习 人工智能 供应链
从概念到商业价值:AI、机器学习与深度学习全景指南
在这个科技飞速发展的时代🚀,人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念,很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别?它们如何相互关联?如何利用这些技术提升工作效率和创造价值?
687 0
|
11月前
|
机器学习/深度学习 人工智能 监控
AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程
本系列文章深入讲解了从Seq2Seq、RNN到Transformer,再到GPT模型的关键技术原理与实现细节,帮助读者全面掌握Transformer及其在NLP中的应用。同时,通过一个房价预测的完整案例,介绍了算法工程师如何利用数据训练模型并解决实际问题,涵盖需求分析、数据收集、模型训练与部署等全流程。文章适合初学者和开发者学习AI基础与实战技能。
1337 25
AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
12月前
|
人工智能 监控 测试技术
云上AI推理平台全掌握 (1):PAI-EAS LLM服务一键压测
在AI技术飞速发展的今天,大语言模型(LLM)、多模态模型等前沿技术正深刻改变行业格局。推理服务是大模型从“实验室突破”走向“产业级应用”的必要环节,需直面高并发流量洪峰、低延时响应诉求、异构硬件优化适配、成本精准控制等复杂挑战。 阿里云人工智能平台 PAI 致力于为用户提供全栈式、高可用的推理服务能力。在本系列技术专题中,我们将围绕分布式推理架构、Serverless 弹性资源全球调度、压测调优和服务可观测等关键技术方向,展现 PAI 平台在推理服务侧的产品能力,助力企业和开发者在 AI 时代抢占先机,让我们一起探索云上 AI 推理的无限可能,释放大模型的真正价值!
|
机器学习/深度学习 PyTorch API
昇腾AI4S图机器学习:DGL消息传递接口的PyG替换
DGL (Deep Graph Learning) 和 PyG (Pytorch Geometric) 是两个主流的图神经网络库,它们在API设计和底层实现上有一定差异,在不同场景下,研究人员会使用不同的依赖库,昇腾NPU对PyG图机器学习库的支持亲和度更高,因此有些时候需要做DGL接口的PyG替换。
|
机器学习/深度学习 PyTorch API
昇腾AI4S图机器学习:DGL图构建接口的PyG替换
本文探讨了在图神经网络中将DGL接口替换为PyG实现的方法,重点以RFdiffusion蛋白质设计模型中的SE3Transformer为例。SE3Transformer通过SE(3)等变性提取三维几何特征,其图构建部分依赖DGL接口。文章详细介绍了两个关键函数的替换:`make_full_graph` 和 `make_topk_graph`。前者构建完全连接图,后者生成k近邻图。通过PyG的高效实现(如`knn_graph`),我们简化了图结构创建过程,并调整边特征处理逻辑以兼容不同框架,从而更好地支持昇腾NPU等硬件环境。此方法为跨库迁移提供了实用参考。
|
人工智能 BI API
Dify-Plus:企业级AI管理核弹!开源方案吊打SaaS,额度+密钥+鉴权系统全面集成
Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,新增用户额度、密钥管理、Web 登录鉴权等功能,优化权限管理,适合企业场景使用。
2143 3
Dify-Plus:企业级AI管理核弹!开源方案吊打SaaS,额度+密钥+鉴权系统全面集成
|
人工智能 智能设计 自然语言处理
2024云栖大会回顾|PAI ArtLab x 通往AGI之路系列活动,PAI ArtLab助力行业AI创新
2024云栖大会回顾|PAI ArtLab x 通往AGI之路系列活动,PAI ArtLab助力行业AI创新

热门文章

最新文章