开发者社区> 知与谁同> 正文

Salesforce 用机器学习来自动总结文本,AI+SaaS 是未来吗?

简介:
+关注继续查看

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如, Salesforce 的 AI 新产品 Einstein 会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型( new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。 MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是 Salesforce 去年收购的深度学习创企 MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce 加入人工智能的军备竞赛,彼时它收购了 iOS 平台第三方智能日历应用 Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除 MetaMind 外,Salesforce 还收购开源机器学习服务商 PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品 Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP 近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

Salesforce 在变得更“聪明”的道路上又进了一步。

如今我们身处海量信息时代,大量时间被用来处理电子邮件、文章或社交媒体的帖子等信息,有预计称,这种消耗状态会超过半天时间,甚至更多。

Salesforce 想将用户从这种低效的工作状态中解放,他们开发了种算法,能自动总结纷繁复杂的信息,如为销售或客户服务代表提供电子邮件和信息总结后的摘要,使他们有更多时间精力专注于自家客户。

例如,Salesforce 的 AI 新产品 Einstein会为那些全天候与电话打交道的客服代表,匹配最可能成为公司用户的电话号码。这饱含着 Salesforce 想把 CRM 系统变得更智能化的美好初衷。

这里用到了 Salesforce 在自然语言处理方面取得的两项新突破:“情境语言生成模型( contextual word generation model )”及“新训练总结模型(new way of training summarization modelst )”,两者一起就能自动为长文本创建较准确可读的摘要。

研究人员指出,自动文本摘要有两种方式:提取( extraction )或抽象( abstraction )。计算机能从文本预先有的措辞中提取,只是目前灵活度还有欠缺;抽象则是计算机在了解原文的基础上,引入新词概括原义。

这背后用到了机器学习技术,深度学习神经网络也在此发挥作用。研究者通过教师强迫( Teacher forcing)、强化学习( Reinforcement learning )来训练系统学习和改进自身。

谷歌 DeepMind 就是强化学习典型案例。所谓强化学习,简单来说,就是训练机器能在采取某种行动后,通过结果的好坏,判定行动的好坏。如棋盘游戏,你能针对对手每步棋作出回应,最终你便能在一系列棋局中找到某步棋的最佳下法,并将此内化成一种积极信号。运用到 Salesforce 将长文本处理成摘要的算法模型上,则有自动评估指标 ROUGE 对结果评分,算法将以更高得分来指导自身更新,最终输出的摘要结果,会逐步提升。

教师强迫(Teacher forcing)是当结果以既定参考的词语得分时,能提供“很体面的结果”,但同时灵活性就得有所牺牲。

研究者们发现,上述两者联合的模式优于其他方法。MIT Technology Review 对比人工总结和用 Salesforce 模型生成的摘要,他们称后者具有“令人惊讶的准确性”,总结不仅比原始文本短得多,重点内容都有所概括,还兼具可读性。

AI+SaaS 是未来?还是噱头?

自动总结模型的背后,是Salesforce 去年收购的深度学习创企MetaMind,这还仅揭露了 Salesforce 人工智能版图的冰山一角。

2015 年 Salesforce加入人工智能的军备竞赛,彼时它收购了iOS平台第三方智能日历应用Tempo AI:通过 AI,Tempo 能自动为用户安排任务和事项,俨然真人版助理;12 月,利用 AI 帮营销人员开展广告活动的公司 MinHash 被纳入 Salesforce 版图;去年除MetaMind 外,Salesforce 还收购开源机器学习服务商PredictionIO 。

拥有大量数据的公司作为发展人工智能底层架构,也是 Salesforce 紧盯的对象。Salesforce 收购了大数据公司 RelateIQ(3.9亿美元),去年还想收购 Twitter ,更意图用比微软 262 亿美元高的价格拿下领英,但未如愿以偿。

微软收购领英后,推出整合 CRM 和 ERP 云产品Dynamics365,与微软自身生态 Office 365 及 Azure 云服务相协同。2016 年 Q2 季度,微软取代 Salesforce 成为 SaaS 行业老大。CEO 纳德拉还宣称未来所有产品都将用到人工智能技术,如 CRM Dynamics 365 就内置 Cortana 人工智能套件。

巨头们营造的大环境莫不如是:竞争激烈、发力人工智能寻求突破重围。几乎与 Salesforce 同段时间,甲骨文发力 AI ,推出自适应智能应用(Adaptive Intelligent Apps);Adobe 为它旗下所有软件提供基于深度学习和机器学习的底层技术平台——Adobe Sensei;IBM 有 Waston;SAP近期开始逐步发力机器学习和人工智能领域 ……

近期中美 SaaS 峰会上,北森 CEO 纪伟国提出,AI + 大数据是重构下一代 HRSaaS 的力量,比如用AI 判断面试官喜好,筛选简历,及从过去积累的人才库里挖掘合适简历,预测人才离职倾向;AI 还能预测并推荐招聘渠道,企业知道把招聘发至哪个网站更合适, 预计收到多少份简历,现在竞争什么状况等。

至此已有数十家厂商明确提出“AI+SaaS”,这里不排除有跟风之嫌,只是当行业趋向如此,对 SaaS 巨头而言,是否做人工智能,或许意味着能否延续竞争优势,甚至是能否继续参与巨头们后期对话语权的争夺。

但这是长期的远景。放置眼下,需要用到人工智能,数据作为前提条件的积累必不可少,这也是为何 CRM 相较其他 SaaS 应用,对人工智能反应更灵敏,毕竟在商务智能时代曾积累一定体量数据样本,且标准化程度较高,数据为 AI 工具应用提供存在合理性。

峰瑞资本创始人李丰则干脆提出:先 SaaS ,再到大数据,再到人工智能。“如果这个行业当中的管理软件或者叫线下数据的线上化还没有完成,那第一步肯定先是SaaS,线下数据的线上化已经比较普遍了之后,才轮到数据处理存储这些事情,这些事情再往下堆迭,随着产生时间越来越长,才到了处理数据的高效化,到了所谓人工智能。”

所以 AI 来了,创企有颗跟随大潮及未来的趋势心固然重要,但缺乏买买买的资金,难吸引高端技术人才的现实还是得认清。或许当下的关键是做好本职,积累尽可能多的数据,厚积薄发。

本文转自d1net(转载)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Elasticsearch Search API之(Request Body Search 查询主体)-上篇
Elasticsearch Search API之(Request Body Search 查询主体)-上篇
3 0
Python编程 基础练习(一)
经典的题目分析和代码实现
11 0
源码分析ElasticJob分片机制
源码分析ElasticJob分片机制
4 0
20180504早课记录03-Linux
今天继续来讲Linux
9 0
单点服务器的 7 种并发模型
模型一:单线程 Accept(无 IO 复用) 模型二:单线程 Accept + 多线程读写业务(无 IO 复用) 模型三:单线程多路 IO 复用 模型四:单线程多路 IO 复用 + 多线程业务工作池 模型五:单线程多路 IO 复用 + 多线程多路 IO 复用(线程池) 模型五(进程版)单进程多路 IO 复用 + 多进程多路 IO 复用(进程池) 模型六:单线程多路 IO 复用 + 多线程多路 IO 复用 + 多线程
5 0
源码分析ElasticJob故障失效转移
源码分析ElasticJob故障失效转移
4 0
令牌桶限流 + 再谈超卖
本篇主要讲解接口限流措施,接口限流其实定义也非常广,接口限流本身也是系统安全防护的一种措施,暂时列举这几种容易理解的: 令牌桶限流 单用户访问频率限流 抢购接口隐藏
4 0
Kafka核心之Consumer
本文介绍Kafka的核心之Consumer。 了解了什么是kafka( https://www.cnblogs.com/tree1123/p/11226880.html)以后 学习Kafka核心之消费者,kafka的消费者经过几次版本变化,特别容易混乱,所以一定要搞清楚是哪个版本再研究。
5 0
+关注
10077
文章
2994
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载