Salesforce 用机器学习来自动总结文本,AI+SaaS 是未来吗?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如, Salesforce 的 AI 新产品 Einstein 会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型( new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。 MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是 Salesforce 去年收购的深度学习创企 MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce 加入人工智能的军备竞赛,彼时它收购了 iOS 平台第三方智能日历应用 Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除 MetaMind 外,Salesforce 还收购开源机器学习服务商 PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品 Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP 近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

Salesforce 在变得更“聪明”的道路上又进了一步。

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如,Salesforce 的 AI 新产品 Einstein会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型(new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是Salesforce 去年收购的深度学习创企MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce加入人工智能的军备竞赛,彼时它收购了iOS平台第三方智能日历应用Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除MetaMind 外,Salesforce 还收购开源机器学习服务商PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
29天前
|
人工智能 自然语言处理 算法
揭秘AI文本:当前主流检测技术与挑战
揭秘AI文本:当前主流检测技术与挑战
310 115
|
29天前
|
人工智能 自然语言处理 数据安全/隐私保护
AI生成的文本:如何识破机器的“笔迹”?
AI生成的文本:如何识破机器的“笔迹”?
315 85
|
29天前
|
人工智能 数据安全/隐私保护
AI生成的痕迹:我们如何检测机器撰写的文本
AI生成的痕迹:我们如何检测机器撰写的文本
491 117
|
29天前
|
机器学习/深度学习 人工智能 算法
火眼金睛:如何检测文本内容是否出自AI之手?
火眼金睛:如何检测文本内容是否出自AI之手?
308 115
|
1月前
|
人工智能 缓存 自然语言处理
Java与多模态AI:构建支持文本、图像和音频的智能应用
随着大模型从单一文本处理向多模态能力演进,现代AI应用需要同时处理文本、图像、音频等多种信息形式。本文深入探讨如何在Java生态中构建支持多模态AI能力的智能应用。我们将完整展示集成视觉模型、语音模型和语言模型的实践方案,涵盖从文件预处理、多模态推理到结果融合的全流程,为Java开发者打开通往下一代多模态AI应用的大门。
306 41
|
1月前
|
人工智能 自然语言处理 自动驾驶
超越文本:多模态大语言模型如何让AI“看世界
超越文本:多模态大语言模型如何让AI“看世界
|
6月前
|
存储 机器学习/深度学习 人工智能
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
1787 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
|
7月前
|
人工智能
WEB CAD 利用AI编程实现多行文本的二次开发
本文介绍了在MxCAD插件中实现自定义编辑器实体类的功能,重点展示如何通过MxCADMText类在CAD中渲染和管理富文本。文章详细说明了注册同心圆实体文本的步骤,包括实现自定义文本类、注册自定义文本以及交互式修改参数的方法。此外,还扩展实践了粗糙度实体文本的注册与应用,涵盖构造粗糙度自定义实体文本类、注册及初始化过程,并通过示例图展示了运行效果。这些功能可帮助用户将复杂图形以文本形式插入多行文本中,提升项目设计效率。
|
SQL 人工智能 关系型数据库
SQL玩转多模态AI,轻松搞定图片+文本混合搜索
本文介绍了一种通过原生SQL实现多模态智能检索的破局思路,基于PolarDB创新融合AI智能引擎,解决传统AI检索系统数据迁移冗余和工具链割裂的问题。方案优势包括低门槛AI集成、灵活适配多场景、全链路数据安全及按需付费免运维。文章详细描述了部署资源、应用配置及方案验证步骤,并提供清理资源指南以避免额外费用。适合希望快速构建智能搜索应用的开发者参考实践。
|
6月前
|
存储 人工智能 自然语言处理
阿里云上的 Salesforce 亮相 2025 AI「巨」场:以 AI 赋能企业未来
阿里云打造的「2025 AI “巨”场·中国 AI 创造力大展」在北京首创·朗园 Station 圆满落幕。Salesforce 作为全球领先的 CRM 企业,携手阿里云,共同亮相本次盛会。

热门文章

最新文章

下一篇
oss云网关配置