Salesforce 用机器学习来自动总结文本,AI+SaaS 是未来吗?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如, Salesforce 的 AI 新产品 Einstein 会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型( new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。 MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是 Salesforce 去年收购的深度学习创企 MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce 加入人工智能的军备竞赛,彼时它收购了 iOS 平台第三方智能日历应用 Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除 MetaMind 外,Salesforce 还收购开源机器学习服务商 PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品 Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP 近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

Salesforce 在变得更“聪明”的道路上又进了一步。

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如,Salesforce 的 AI 新产品 Einstein会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型(new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是Salesforce 去年收购的深度学习创企MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce加入人工智能的军备竞赛,彼时它收购了iOS平台第三方智能日历应用Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除MetaMind 外,Salesforce 还收购开源机器学习服务商PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
机器学习/深度学习 数据采集 人工智能
探索AI技术在文本生成中的应用与挑战
【9月更文挑战第26天】本文深入探讨了AI技术在文本生成领域的应用,并分析了其面临的挑战。通过介绍AI文本生成的基本原理、应用场景以及未来发展趋势,帮助读者全面了解该技术的潜力和局限性。同时,文章还提供了代码示例,展示了如何使用Python和相关库实现简单的文本生成模型。
101 9
|
5天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
73 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
Meta AI推出的Llama 3.3是一款70B参数的纯文本语言模型,支持多语言对话,具备高效、低成本的特点,适用于多种应用场景,如聊天机器人、客户服务自动化、语言翻译等。
53 13
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
|
8天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
50 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
43 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
18天前
|
人工智能 自然语言处理 知识图谱
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快
英伟达提出nGPT(Normalized Transformer),通过单位范数归一化和超球面上的表示学习,显著提升了Transformer模型的训练速度和性能。实验显示,nGPT在处理4k长度序列时,训练速度比传统Transformer快10倍,且在多个下游任务中表现出色。论文地址:https://arxiv.org/pdf/2410.01131
35 12
|
1月前
|
人工智能 自然语言处理 监控
AI技术在文本情感分析中的应用
【10月更文挑战第22天】本文将探讨人工智能(AI)如何改变我们对文本情感分析的理解和应用。我们将通过实际的代码示例,深入了解AI如何帮助我们识别和理解文本中的情感。无论你是AI新手还是有经验的开发者,这篇文章都将为你提供有价值的信息。让我们一起探索AI的奇妙世界吧!
82 3
|
2月前
|
人工智能 搜索推荐 API
用于企业AI搜索的Bocha Web Search API,给LLM提供联网搜索能力和长文本上下文
博查Web Search API是由博查提供的企业级互联网网页搜索API接口,允许开发者通过编程访问博查搜索引擎的搜索结果和相关信息,实现在应用程序或网站中集成搜索功能。该API支持近亿级网页内容搜索,适用于各类AI应用、RAG应用和AI Agent智能体的开发,解决数据安全、价格高昂和内容合规等问题。通过注册博查开发者账户、获取API KEY并调用API,开发者可以轻松集成搜索功能。
|
2月前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
101 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
3月前
|
人工智能 关系型数据库 分布式数据库
用友X阿里云:加速AI in SaaS
在今年的云栖大会上,用友公司与阿里云共同宣布将进一步加深合作,推动用友BIP与阿里云深度融合,以SaaS模式为诸多大中型企业客户提供一体化解决方案。同时,通义大模型已作为底层基础大模型集成到用友企业服务大模型YonGPT,加速企业数智化转型。
78 7

热门文章

最新文章