【云栖大会】阿里研究院:阿里巴巴人工智能应用的五部曲

本文涉及的产品
票证核验,票证核验 50次/账号
票据凭证识别,票据凭证识别 200次/月
通用文字识别,通用文字识别 200次/月
简介: 从今年年初的AlphaGo人机大战之后,人工智能成为了产业界最受关注的一大热点。其实,从1956年人工智能概念出现迄今已经60年的历史了,人工智能也经历了几番起起落落。为何今天成为了业界热点呢?归结起来,实际上是三大技术基础的成熟和发展奠基了人工智能的落地。

本文转载自 阿里商业评论 文 | 阿里数据经济研究中心秘书长 潘永花 原文链接


从今年年初的AlphaGo人机大战之后,人工智能成为了产业界最受关注的一大热点。其实,从1956年人工智能概念出现迄今已经60年的历史了,人工智能也经历了几番起起落落。为何今天成为了业界热点呢?归结起来,实际上是三大技术基础的成熟和发展奠基了人工智能的落地。

人工智能=数据+计算能力+算法

首先,人工智能对计算能力的要求很高,而以前研究人工智能的科学家往往受限于单机计算能力,需要对数据样本进行裁剪,让数据在一台计算机里进行建模分析,导致模型的准确率降低。伴随着分布式计算能力的迅速发展,云计算平台可以利用成千上万台的机器进行计算,尤其是GPU的发展为加速人工智能落地奠定了基础计算能力,使得类似于人类的深层神经网络算法模型为代表的人工智能应用成为现实;

其次,大数据时代已经到来,多来源、实时、大量、多类型的数据可以从不同的角度对现实进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础;

第三,是算法的发展尤其是Geof Hinton教授2006年发表的论文,开启了深度学习在学术界和工业界的浪潮,以人工神经网络(ANN)为代表的深度学习算法成为了人工智能应用落地的核心引擎。

因此,计算能力+数据+算法三者相辅相成、相互依赖、相互促进,使得人工智能有机会从专用的技术成为通用的技术,融入到各行各业之中。


33e01ba52662fe8e7e9b34717f107855f0fae484



阿里巴巴在人工智能技术研发以及应用场景方面进行了大量的实践,通过在电商、物流和金融相关的业务应用场景中不断积累人工智能核心技术,并逐渐通过阿里云ET平台输出到交通、政府、娱乐等更多的行业之中。

1.人工智能从替代客户服务到个性化助理

客户服务是很多行业的通用场景,覆盖银行、保险、电信、零售、制造、电商等多个行业,过往这些行业主要依靠自建或者租用呼叫中心,雇佣大量的客户服务人员提供服务,而大部分企业的客户服务中心都是企业的成本中心。

伴随着基于人工智能技术的智能客服的出现和发展,客服人员可能真会在不远的将来被机器替代掉了。Gartner最新报告预测,2020年智能机器人座席能满足40%的客服市场需求。未来,基于人工智能技术的智能机器人客服不仅能理解客户语言的上下文语义,还具备自我学习能力,可以理解口语化问题、分辨问题焦点,大大提升服务效率和水平,同时能够给客户提供更好的个性化体验。


f7657a15671d402c13413c5271eb6734bd8832ce


以2015年7月阿里巴巴集团发布的人工智能购物助理虚拟机器人 “阿里小蜜”为例,它的目标就是致力于成为会员的购物私人助理,让会员专享1对1的客户顾问服务、全程陪伴式、安全有保障的购物体验。这款应用基于语音识别、语义理解、个性化推荐、深度学习等人工智能技术,支持上下文理解的多轮对话,以及个性化记忆功能,同时机器人每天都会去学习几百万条人工的服务记录以及海量的知识源,自动改善智能解决能力。在淘宝和天猫平台上,每天有近5万次热线电话求助,无线端的在线服务量更是每天都超过100万次。

目前,“阿里小蜜”在每天应对百万级服务量的情况下,智能解决率达到了接近80%,甚至在部分重点场景上已经达到95%的智能解决率,满意度比传统的自助服务提升了一倍。同时,阿里巴巴利用人工智能技术对客户服务质量进行监控,减少人工干预,大幅提高了服务质量。

除了成为客户服务助理之外,基于人工智能的虚拟机器人融入更深入的语音识别、自然语言处理等技术,未来将会在很多场景下可能成为个性化助理,为不同的客户依据个性化需求提供不同的服务,能真正和人进行深入沟通,使得机器与人的交流更加自然、亲切和人情味,比如家庭服务、医疗服务、购物助手等。

2.计算机视觉技术在电商场景应用广泛:从身份识别、图片搜索到违规图片识别

计算机视觉技术是人工智能技术的核心技术之一。而作为计算机视觉技术中的关键基础,指纹及人脸等生物识别技术目前已经开始应用在身份识别的多个领域,比如支付宝钱包已经能够支持指纹和人脸识别的身份认证,刷脸支付成为了现实。

在未来,实现“所见即所得”会是电商的重要方向,图片搜索更将成为人们获取信息的常态。图像识别在手机淘宝的“拍立淘”产品中已经开始应用,通过手机拍照即可搜索相似商品,2015年双11当天,千万消费者使用了“拍立淘”功能,创造了超过数千万元的销售额。


16a46f82605cf370f01b84b538bbcbaf123ca34d


图中文字识别(OCR)一直是计算机视觉领域的难点。阿里巴巴平台很多营销创意、商品都以图片形式存在,同时,也有一些商家在图片中内嵌违规的信息实现恶意推广的目的,图片内文字违规是比例相当大的一类,而传统监控手段多以人工肉眼来审核,费时费力,尤其是随着图片数量越来越大,这几乎已成为不可完成的任务。从2014年开始,阿里妈妈图像团队开始重点攻坚OCR技术,通过机器视觉的方式从图片中识别出文字,从而鉴别出违规的文案信息。

2016年6月,阿里巴巴旗下广告交易平台阿里妈妈图像团队的OCR(图中文字识别)技术刷新了ICDAR Robust Reading竞赛数据集的全球最好成绩,并大幅超越第二名。借助这一领先的OCR技术,阿里妈妈图像团队能够以95%的超高准确率识别图中违规文字信息,有效过滤商家恶意推广,维护消费者权益。2015年,阿里妈妈累计屏蔽了4600万条恶意推广。

阿里绿网依托于阿里巴巴全生态体系,拥有海量的特征样本及丰富的数据模型分析经验,也利用OCR技术进行了黄色图片鉴别。根据技术人员的测试,通过人工智能技术鉴别黄色图片,准确率高达99.6%以上。

3.人工智能在金融业应用:从客服、风控到业务创新

人工智能未来会重构金融服务的生态,成为普惠金融的基石,金融的个性化、场景化服务成为主要创新方向。伴随着基于大数据的机器学习算法的发展以及语音识别、人脸识别、自然语言处理技术的日趋成熟,蚂蚁金服已经将人工智能技术运用于蚂蚁微贷、保险、征信、风险控制、客户服务等多个领域。比如通过机器学习技术把蚂蚁微贷和花呗的虚假交易率降低了10倍。为支付宝的证件审核系统开发的OCR系统,使证件校核时间从1天缩小到1秒,同时提升了30%的通过率。2015年“双11”期间,蚂蚁金服95%的远程客户服务已经由智能机器人完成,同时实现了100%的自动语音识别。

蚂蚁金服与保险公司合作的“航空退票险”上线之后赔付率一度高达190%,保险公司面临巨大的亏损压力。通过引入机器学习技术,大数据技术建模、优化后,有效地降低了赔付率,并成功扭亏为盈,满足了保险公司的核保要求。

4.人工智能助力交通出行

从交通的角度来看,今天的交通拥堵对于城市管理者来说是个很大的难题,对于出行者来说路径的选择也一直是个问题;想像一下伴随着基于人工智能的无人驾驶汽车、无人机、送货机器人等产品的问世和成熟,交通管理的范畴将会变得更加复杂多变。阿里巴巴在利用人工智能技术实现交通状况的预测、控制和管理方面进行了一些有益的探索。


942a4753221c3647243f1e4a1a958c1b6ac3da09


在交通拥堵控制和预测方面,基于交通历史数据,实时路况数据,手机基站信令数据,视频监控数据,信号灯运行数据等多数据源的整合,使用人工智能中的机器学习算法,可以实现交通拥堵的提前预测,并提醒管理者提前采取相应措施,同时也能帮助交通管理部门进行道路的更合理规划设计和对交通信号装置等相关因素进行调整,降低路况拥堵率。比如,为了解决拥堵难题,广州市交警近日引入人工智能技术阿里云ET搭建了“互联网+信号灯”控制优化平台。据了解,ET可对路口车辆运行情况进行分析,并输出对红绿灯时间的调整建议。试点结果显示,部分路段拥堵指数下降超25%。

同时,大数据与机器学习能力的结合还能够帮助出行者实现更优质的智能出行决策,可以根据用户地域、距离、时长、工具等不同场景学习不同的出行决策,形成出行决策模型;根据用户的定位数据、出行数据、反馈数据,也可以为用户提供省时、省力以及舒适性的偏好决策模型。比如,高德推出高德地图AI引擎,该引擎将基于高德出行大数据和机器学习能力,面向不同环境和需求,为用户提供“千人千面”的位置出行服务。

5.人工智能解放速记员和书记员?

根据Gartner预测,到2018年,客户数字助手将能跨渠道和合作伙伴识别人脸和声音:机器在倾听指令和告诉我们该做什么上比真人表现更好。语音识别和自然语言处理技术基础上的人工智能应用场景非常丰富,速记员和书记员的未来可能被智能机器人替代。

比如,在今年的阿里云2016年会上,阿里云ET的速记能力就曾在准确率方面以0.67%的微弱优势战胜第50届国际速联速记大赛全球速记亚军姜毅。9月13日,浙江省高级人民法院对外宣布,将在全省105家法院全面上线智能语音识别系统。该系统由阿里云人工智能ET提供技术支持,能够快速、准确的完成庭审记录,承担起“书记员”的角色。3个月前,系统曾在西湖区人民法院试点,准确率高达96%。这些都是阿里人工智能技术与行业应用场景落地的案例。

当然,目前的时代依然是弱人工智能时代,人工智能技术还主要为了解决特定的问题而存在,是任务型的人工智能,未来能否真的拥有人一样的思考、感知和认知能力还有很长的一段路要走。但总起来看,我们认为人工智能会有非常广泛的应用场景,既有通用的跨行业的场景,比如客户服务,个性化推荐,身份识别,网络营销,风险控制等;也会有针对某些特定行业的场景,比如交通出行、金融投资、医疗问诊、娱乐、制造、教育等行业的应用。


感谢 阿里商业评论 对2016杭州云栖大会的精彩报道!

相关文章
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】TF-IDF算法在人工智能方面的应用,附带代码
TF-IDF算法在人工智能领域,特别是自然语言处理(NLP)和信息检索中,被广泛用于特征提取和文本表示。以下是一个使用Python的scikit-learn库实现TF-IDF算法的简单示例,并展示如何将其应用于文本数据。
115 65
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】Foxmail邮箱在人工智能领域的应用方法及代码解析
Foxmail邮箱作为一款流行的邮件客户端软件,主要用于个人和企业的邮件收发、管理等功能。虽然它与人工智能(AI)技术有着潜在的融合点,但直接关于Foxmail邮箱在人工智能方面的应用代码并不是常规的讨论内容,因为邮箱客户端本身并不直接包含复杂的AI算法或代码。
110 58
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】Python之人工智能应用篇——音频生成技术
音频生成是指根据所输入的数据合成对应的声音波形的过程,主要包括根据文本合成语音(text-to-speech)、进行不同语言之间的语音转换、根据视觉内容(图像或视频)进行语音描述,以及生成旋律、音乐等。它涵盖了声音结构中的音素、音节、音位、语素等基本单位的预测和组合,通过频谱逼近或波形逼近的合成策略来实现音频的生成。 音频生成技术的发展主要依赖于深度学习模型,如循环神经网络(RNN)、长短时记忆网络(LSTM)、Transformer等。这些模型通过学习大量的音频数据,能够自动生成与人类发音相似甚至超越人类水平的音频内容。近年来,随着大规模预训练模型的流行,如GPT系列模型、BERT、T5等,
12 7
【深度学习】Python之人工智能应用篇——音频生成技术
|
2天前
|
机器学习/深度学习 人工智能 算法
人工智能在医疗诊断中的应用与挑战
【8月更文挑战第18天】 随着人工智能技术的飞速发展,其在医疗领域的应用也日益广泛。从影像诊断到病理分析,AI技术正逐步改变着传统的医疗诊断方式。然而,随之而来的数据隐私、算法透明度等问题也不容忽视。本文将探讨AI在医疗诊断中的具体应用案例,分析其带来的优势与面临的挑战,并提出相应的解决策略。
|
2天前
|
机器学习/深度学习 人工智能 算法
【深度学习】python之人工智能应用篇——图像生成技术(二)
图像生成是计算机视觉和计算机图形学领域的一个重要研究方向,它指的是通过计算机算法和技术生成或合成图像的过程。随着深度学习、生成模型等技术的发展,图像生成领域取得了显著的进步,并在多个应用场景中发挥着重要作用。
15 9
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】python之人工智能应用篇——文本生成技术
文本生成是指使用自然语言处理技术,基于给定的上下文或主题自动生成人类可读的文本。这种技术可以应用于各种领域,如自动写作、聊天机器人、新闻生成、广告文案创作等。
18 8
|
2天前
|
机器学习/深度学习 人工智能 搜索推荐
【图像生成技术】人工智能在广告营销的革新:图像生成技术的应用与实践代码示例
随着人工智能技术的飞速发展,广告营销行业迎来了前所未有的变革。图像生成技术,作为AI领域的一颗璀璨明星,正被广泛应用于创造个性化、高吸引力的产品展示图、海报乃至宣传视频,以精准对接目标受众,显著提升广告的转化率和整体营销效果。本文将深入探讨这一技术的应用场景,并通过一个简单的代码示例,展示如何利用深度学习框架TensorFlow来实现创意图像的自动生成。
13 4
|
2天前
|
机器学习/深度学习 人工智能 算法
【人工智能】线性回归模型:数据结构、算法详解与人工智能应用,附代码实现
线性回归是一种预测性建模技术,它研究的是因变量(目标)和自变量(特征)之间的关系。这种关系可以表示为一个线性方程,其中因变量是自变量的线性组合。
9 2
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】python之人工智能应用篇——视频生成技术
视频生成技术是一种基于深度学习和机器学习的先进技术,它使得计算机能够根据给定的文本、图像、视频等单模态或多模态数据,自动生成符合描述的、高保真的视频内容。这种技术主要依赖于深度学习模型,如生成对抗网络(GAN)、自回归模型(Auto-regressive Model)、扩散模型(Diffusion Model)等。其中,GAN由两个神经网络组成:一个生成器用于生成逼真的图像或视频,另一个判别器用于判断生成的图像或视频是否真实。通过不断的对抗学习,生成器和判别器共同优化,以产生更高质量的视频。
10 2
|
1天前
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在医疗诊断中的应用
【8月更文挑战第18天】随着科技的迅速发展,人工智能技术已渗透到我们生活的方方面面,特别是在医疗领域的应用引起了广泛关注。本文将深入探讨人工智能如何在医疗诊断中发挥其巨大潜力,包括疾病预测、医学影像分析以及个性化治疗计划的制定等方面。通过具体案例分析,文章揭示了AI技术如何提高诊断准确率,降低误诊率,并在一定程度上缓解医疗资源紧张的问题。同时,也将讨论人工智能在医疗诊断领域面临的挑战和未来发展趋势。

热门文章

最新文章