【干货】阿里云的人工智能是如何实战的?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 如何利用大数据创造商业价值?阿里云在人工智能领域做了哪些创新和实践?如何利用大数据为机场管理保驾护航?

如何利用大数据创造商业价值?阿里云在人工智能领域做了哪些创新和实践?如何利用大数据为机场管理保驾护航?

从预测到改变

闫新发,花名算者,人如其名:在2013-2015年期间,个人几乎包揽了阿里巴巴集团内部大数据竞赛的所有冠军;2015年带领团队在世界推荐算法比赛 (ACMRecSys Challenge,算法领域的世锦赛)取得第二名的成绩,2016年该团队在该比赛获得世界第一名。

他穿着一件简单的黑色阿里云T恤,为华工的同学们带来了大数据的实际应用案例。

image.png

首先,在阿里巴巴集团,算法创造了什么价值?

在电商领域,创下1207亿人民币交易额的2016天猫双11的狂欢刚刚落幕。据统计,开场的前30分钟,每秒交易峰值17.5万笔,每秒支付峰值12万,双双刷新纪录。要知道,七年前的第一次双11,交易峰值仅为400笔每秒,支付峰值仅为200笔每秒,8年增长数百倍。

巨额的交易额背后是强大的技术支撑。阿里不仅为用户提供商品,而且希望让数亿用户从十几亿商品中迅速找到所需。依靠推荐系统,我们做到了千人千面。所谓千人千面,即个性化推荐,其一是首页的个性化,这是一个流量分发的过程,即每个用户来到淘宝之后,看到的都是为自己专门定制的个性化首页:

image.png

例如有宝宝的妈妈看到的是母婴用品及育儿常识等,如果家里有一大一小两个宝宝,系统会自动推荐婴儿用户的奶瓶和儿童用户的玩具等。相当于不同的消费者来到同一个商场进入的却是不同的楼层在每个楼层看到的也是不同的店面一样。这样就实现了上亿用户和十余亿商品之间的精准匹配,对消费者而言,获得了差异化的服务;其二是店铺的个性化,即用户来到某一个店铺看到的也是她/他最喜欢的商品。

image.png

最简单的例子就是女性用户和男性用户来到同一家淘宝店铺看到的是不一样的店铺承接页,女性看到是可爱的粉色页面,是女装,男生看到的可能是庄重的黑色页面和男装,这就好比每个人进了一家线下店看到的都是不一样的装修风格和不同的商品陈列,从而让用户产生更多的共鸣,有了更好的购物心情。

千人千面在有效提高转化率的同时也为用户提供了更愉悦的体验。正如马老师所说:“今天的成绩已经很满意了!双11已经不是数字上看销售额是多少,我们最希望双11给所有的买家和卖家带来快乐,快乐是我们最希望能够量化的东西。”

还有天猫运费险的应用、物流的革新;在金融领域,芝麻信用的评价体系构建;在云计算领域,应用跨集群的优化等等都是在技术的支撑下创新商业模式,创造价值。

其次,大数据在基础产业亦发挥作用。比如在新能源领域,对风力进行预测,解决风力和火力的均衡问题,实现电网并网负载的均衡;在农业、林业领域,通过图像识别进行病虫害检测、产量预测等。

image.png

同时,在我们日常生活中,算法无处不在。我们旅游中常常购买特价机票,实际上是预测了未来三天的低价,再以未来某一天的低价的轻微上浮在当前进行出售;即食食品零售商对未来几天的食品需求进行预测,再决定进货量,做到最大化销售,最小化退货;借助云计算不仅能进行导航、软件打车,还能预测未来路况,从而避开高峰期和拥堵地带,提高出行效率等。

在云计算领域,借助阿里云孵化器这一平台,大数据已改变许多行业,比如针对行业通用问题,建构企业图谱,让企业有谱,让舆情可控;在传统零售业预测销量;针对创业类公司,利用调度算法创新其商业模式;利用技术服务客户,利用云计算平台进行3D建模,提高效率;在传统工业通过算法优化提高工艺良品率。

从科技到普惠

通过算者的详尽介绍可以发现,过去我们对大数据的研究多侧重于理念、发展未来、研究性产品,现在的重点更在于大数据的落地。数据技术的应用不仅仅局限于阿里系的物流、电商、金融领域,而是拓展到各行各业,阿里云致力于将它的能力赋能给各个行业,在各个产业落地。

“人工智能是基础,行业才是成为数据科学家的关键。”这是阿里云人工智能首席科学家、小Ai之父闵万里博士在内部常说的一句话。

阿里巴巴从来就不仅是一家科技公司。计算,一定要成为普惠科技,成为各行各业能够简单获取的能力,才能不断去创造“无法计算的价值”。

阿里云搭建的天池大数据平台(tianchi.aliyun.com),基于阿里云的海量数据处理服务MaxCompute,向社会提供科研数据和开放数据处理服务,旨在打造“数据众智、众创”第一平台,目前,天池平台拥有5万+名高质量数据人才,是最大的数据爱好者社区。天池大数据竞赛是基于天池平台开展的数据类竞赛活动,包括算法大赛、可视化大赛和程序设计大赛等多种形式的竞赛,向社会提供科研和实际产业的数据,大赛让所有参与者有机会运用其设计的算法解决各类社会生活问题和商业世界中的实际问题。

image.png

正如此次2016“数据引领飞粤云端”广东航空大数据创新大赛,在广东省政府和阿里巴巴集团的有力推动下,联合广东省经信委、惠州市人民政府、阿里云、广州机场白云科技有限公司共同举办,首次开放航空数据,不仅是一场比赛,更进一步是培养大数据应用人才,鼓励数据创新创业实践,推动民航业大数据技术成果转化和落地。

讲座现场,算者对同学们提出期待:借助阿里云天池平台提供的丰富资源,希望学生通过拓宽眼界,除了学好理论知识,做好研究之外,学生还要多看看外面的世界,思考大数据有可能在哪些行业落地,自己将来会进入哪个行业,如何将对技术的热爱与职业发展相结合。埋头看书的同时也要抬头看路。

(大)数据+(高级)算法=(小)目标

回到问题的原点,是不忘初心。大数据的“初心”是明确其目标,再去思考所需的数据和算法。目标的优化能带来方法的改进和效率的提升。比如阿里云的人工智能ET,待解决问题是如何做决策,如何优化交通,解决方法是通过不断强化学习,而这整个过程都是围绕优化路线这个目标进行的。在我们日常生活中、各行各业的运行中有各种各样的目标,这些目标有大有小,有宏观为微观,大到如何让出行更顺畅,小到如何通过图像识别技术自动识别几百万公里线缆上的某一处是否有厘米级的破损,让我们一起探索用大数据来实现它。

说到人工智能ET,就不得不提阿里云的一支神秘“特种部队”——阿里云大数据孵化器。这是一群由科学家组成的团队,通过利用阿里云强大的计算平台加上顶级专业的算法与行业数据有机的融合,正在积极探索人工智能在各行业中的应用,不断的挖掘数据的价值,实现用数据驱动行业创新,用数据提升业务效率。

image.png

▲阿里云大数据孵化器团队首席数据科学家闵万里(山景)博士▲

数据,即是创新的源泉,也是创新的工具。经济和商业的本质从某种角度来讲,是在各种有限资源的输入下,采用新的方法整合这些资源,提供差异化的服务,创造商业价值的过程。整个过程就是创新的过程,数据既是一种资源(创新的源泉),也是盘活资源的工具(创新的工具)。

数据,使不可能的东西变成可能,使传统产业重新焕发活力。双11,00:00:09付款成功,00:06:51商品完成打包从仓库发出,00:13:19签收成功。佛山芦苞镇黄先生还在买买买的时候,菜鸟联盟成员EMS就送来了包裹。通过用户需求预测,提前铺货,双11第一单快递仅用13分钟便送达,正是大数据对物流业的创新。

菜鸟网络CTO王文彬在2016云栖大会上说:“物流行业的竞争力已经走出单纯依靠规模和价格的竞争,技术竞争将成为关键。物流云的加速发展能够重新定义整个智慧物流,帮助行业升级,应该成为行业的基础设施。我们的目标是国内24小时送达,全球72小时送达。”

数据也变成了一种资源。工业时代机器烧煤来产生动力,而数据时代我们烧“数据”来推动产业,比如天猫推出的运费险,综合商品退货率情况、用户退货行为习惯等数据信息,进行个性化运费险定价,提高转化率,增加收益;比如综合用户的支付历史行为、履约能力、行为偏好等数据信息评估,评出的芝麻信用分数可用于“未来酒店信用住”,先住店后付款。

image.png

在讲座最后的问题环节,无论是“业务与数据哪个更重要”等方向性疑问,还是“推荐算法在具体推荐商品中如何选择”等拓展性问题,还是“非科班出身如何在数据时代发挥价值”等职业困惑,同学们抓住机会纷纷抛出问题。直到讲座结束,仍有许多同学围着算者请教疑惑。从这群90后甚至95后年轻人对数据的兴趣和未知的求解中也许可以期待,新生代假以时日会成为主力军。

正如马老师在2015年云栖大会的主题演讲中所总结的那样:中国一定会成为一个计算大国,因为未来的数据是一种生产资料,而未来的生产力就是计算能力和在座的所有创业者的创新能力,企业家精神。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
16天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
75 2
|
25天前
|
存储 人工智能 分布式计算
Parquet 文件格式详解与实战 | AI应用开发
Parquet 是一种列式存储文件格式,专为大规模数据处理设计,广泛应用于 Hadoop 生态系统及其他大数据平台。本文介绍 Parquet 的特点和作用,并演示如何在 Python 中使用 Pandas 库生成和读取 Parquet 文件,包括环境准备、生成和读取文件的具体步骤。【10月更文挑战第13天】
193 60
|
23天前
|
存储 人工智能 自然语言处理
Elasticsearch Inference API增加对阿里云AI的支持
本文将介绍如何在 Elasticsearch 中设置和使用阿里云的文本生成、重排序、稀疏向量和稠密向量服务,提升搜索相关性。
65 14
Elasticsearch Inference API增加对阿里云AI的支持
|
20天前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
16天前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
|
16天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
10天前
|
人工智能 架构师
活动火热报名中|阿里云&Elastic:AI Search Tech Day
2024年11月22日,阿里云与Elastic联合举办“AI Search Tech Day”技术思享会活动。
153 2
|
11天前
|
存储 人工智能 大数据
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
18天前
|
存储 人工智能 弹性计算
对话阿里云吴结生:AI时代,云上高性能计算的创新发展
在阿里云智能集团副总裁,弹性计算产品线负责人、存储产品线负责人 吴结生看来,如今已经有很多行业应用了高性能计算,且高性能计算的负载正呈现出多样化发展的趋势,“当下,很多基础模型的预训练、自动驾驶、生命科学,以及工业制造、半导体芯片等行业和领域都应用了高性能计算。”吴结生指出。
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。