阿里云新一代智能计算:灵骏来了!

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 灵骏,阿里云新一代智能计算!

首图-图标.png


【阅读原文】戳:阿里云新一代智能计算:灵骏来了!


「阿里云宣布正式推出

端到端智能计算解决方案“飞天智算平台”

启动张北、乌兰察布两座超级智算中心

为科研机构、科技企业提供智能计算服务

强大算力让AI更具想象力


在今天下午的飞天智算平台发布会上,阿里云新一代智能计算产品——灵骏」正式亮相!具备公共云、专有云等多种产品形态,可为人工智能等应用提供高效的绿色算力。


20220830153041-YWX_5242-308443828-opq308452567.png


人工智能是一个算力饥饿的领域,AI算力需求每3.5个月翻一倍,过去六年AI算力需求已增长了30万倍,面对这种爆发式的算力需求,简单粗暴的硬件堆砌不可持续,在这之上我们需要更加高效、更加绿色的智能算力。

—— 阿里云灵骏智能计算产品研发负责人曹政



灵骏:阿里云新一代智能计算产品

图片1.png

1 产品名称灵骏。寓意:智能算力如骏马奔腾,为科技创新和产业升级带来澎湃算力加速度。


2 产品特性:一云多芯,提供融合算力池,能进行超大规模融合算力调度,绿色低碳。


 一云多芯:支持国产化CPU/GPU芯片,通过自研“共中心架构”,解决多芯融合及跨代兼容问题。


 融合算力池:基于云原生技术体系,实现异构算力资源池化(eGPU),使资源利用率提升3倍,最小化数据搬迁成本,加速AI研发过程;多元化算力支持混合负载,满足人工智能等多领域应用混合部署。


 深度性能优化:建立万卡级计算系统的通信与调度能力,通过RDMA与自研系统软件(C4、KSpeed),大规模场景性能可提升2-5倍。


自研RDMA高速网络架构,将时延显著降低90%;自研通信库(C4),结合自研硬件,对超大规模AI计算系统提供无拥塞、高性能的通信环境;针对数据密集型场景,通过自研系统软件KSpeed,最高可将系统IO性能提升10倍。


 绿色低碳:支持自研单相浸没液冷技术,PUE最低可至1.09,能耗最高可降低50%。


3 应用场景:已在自动驾驶、医疗制药、科研智能等领域得到广泛应用,为人工智能技术在各行各业的探索到落地,提供坚实支撑。


20220830152519-WYQ_4165-308444267-opq308449069.jpg



01应用驱动 因云而生


2014年,淘宝商品图搜系统上线,只需一张照片,消费者就能搜到精准的商品,这种AI驱动的能力,带来了文字搜索无法企及的消费体验,很快就达到千万级的日均用户使用量,成为了世界上最大的图搜商品系统。以当时的计算架构,商品图搜系统的核心模型进行一次全量学习需要2.5个月左右,对快速发展的在线业务而言,计算效率从一个技术问题已然变成了一个客观存在的业务瓶颈,随之而来的是大数据、AI技术应用如雨后春笋般百花齐放。


为了充分释放业务的想象力,2018年,阿里云正式启动“灵骏”产品研发,旨在通过系统架构、计算框架和业务算法的全面创新,端到端提升计算效率,淘宝作为世界最大的商品图搜系统,成为“灵骏”应用实践的不二之选。


为了优化计算效率,阿里云的工程师们对AI类应用运行过程进行深入测试,对每一个线程、每一步操作进行解构,从而定位不同层次的效率瓶颈。通过分析发现以AI、大数据为代表的应用具备高密度、超大数据量的负载特征,并且各自有不同的通信模型,为这样的场景提供最匹配的计算资源,面临着规模、效率、资源利用率等三大挑战。



02探索突破 砥砺前行


从计算负载看,AI不仅需要逻辑算力(CPU),浮点算力(GPU)也同等重要;同时AI应用涉及到大量的统计运算,计算卡之间需要高频次、高密度的数据交换,对系统通信和I/O性能要求极高,确保更多的计算卡保持高效的数据交换,是第一个技术攻关点,这将直接影响算力规模和计算效率。同时,作为普惠技术,云计算对资源利用率有天然的高要求,基于云原生的技术导向,面向各种架构的物理节点进行资源共享技术开发,则成为另一个技术攻关点。


2018年,“灵骏”开发出第一代产品,助力淘宝商品图搜系统全量学习时间从之前的2.5个月降至8小时;2019年,第二代产品上线,资源共享技术方案把一个个孤岛资源变成可支持时空序列调度的资源池,在不增加硬件支出的情况下,支撑更大体量的业务。同年云栖大会上,阿里巴巴晒出AI业务规模:服务全球10亿人,日均处理超过10亿张图片,5000亿句自然语言。2021年,达摩院发布业界最大预训练模型M6,模型参数达到10万亿。


阿里云深入到应用的计算负载特征,通过“灵骏”和机器学习平台PAI在云上为多元化的新型计算场景定义智能算力,过程中充分发挥软硬一体技术优势,突破纯软件优化的局限,实现计算平台到物理节点端到端性能优化,从而将计算效率提升到全新的水平,代表着新一代智能计算技术的发展方向。



03智算时代 算力激发经济动能


数字经济时代,AI应用不再局限于扫脸核身,同时在多领域飞速渗透,而普惠的智能算力也正成为科技发展和产业创新的新型助推器!


AI让科学更智能

AI正成为科研助手。科学家们已通过AI完成2.14亿蛋白质结构预测,覆盖了近百万物种,蛋白质是生命功能的基本单位,其结构与功能紧密相关。蛋白质结构的研究将为健康、医疗等领域带来丰富的产业收益。而通过AI加速的分子动力学模拟、仿真等技术,让技术和研发人员具备通过算力还原不同物理/化学过程的能力,正为生物制药、电池技术、材料技术等领域带来颠覆性的效率提升。


阿里云具备丰富的AI平台和产品矩阵,在提供全生命周期开发服务的同时,通过平台聚合开发者和技术生态,推动跨学科、跨领域充分合作,激发创新活力。


AI让产业更智能

通过AI生成内容的技术飞速发展,AI数字人、智能场景生成等应用成为元宇宙领域的核心技术,有机会催生新一代的科技产业浪潮;以达摩院M6为代表的AI设计师已将服务落地,输入文字就能设计新款的连衣裙,在纺织、服装等场景带来巨大的想象力。


阿里云拥有丰富的产业互联网实践经验,通过云服务和前沿的AI技术对产业形成效率牵引,结合云原生的技术生态,加速经济效率,助力高质量发展。


算力,AI核心竞争力

前沿的AI技术,对算力的需求每3.5个月翻一倍,远超摩尔定律(处理器的性能大约每两年翻一倍),“灵骏”通过软硬一体优化带来的性能和拓展性的跨越式升级,得以轻松应对算力增长的挑战,并且通过云原生的方式支持各类高性能计算生态,通过统一的计算服务和AI平台,构建科技+产业协同发展的实践高地。8月2日,阿里云和小鹏汽车在乌兰察布合作建成中国最大自动驾驶智算中心“扶摇”,600PFLOPS算力规模使模型训练提速170倍,有望将完全自动驾驶的规模化落地进程往前推进5年。


推荐阅读:和小鹏一起,建中国最大自动驾驶智算中心!



04全速奔赴 算力未来


今天,数据已成为经济发展的重要生产资料,算力则担当了数字经济发展的“生产力”,人工智能与实体经济紧密融合,推动了产业智能化的趋势。阿里云新一代智能计算产品灵骏应时而生,独特的技术优势,不同行业丰富的应用场景,结合阿里云在大数据、AI等领域丰富的产品和平台服务,将撬动新型产业的发展势能,为高质量发展提供算力加速器!


点击此处,了解更多“灵骏”产品



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
智能计算有哪些
智能计算有哪些
|
存储 人工智能 弹性计算
阿里云张献涛:云原生计算服务,加速互联网迈入智能时代
阿里云提供的全方位、立体化的弹性计算服务,可以为互联网企业提供弹性、高性能与成本三方兼顾的云原生基础设施,助力互联网企业快速迈入智能化时代。在阿里云云峰会2023北京站《互娱&游戏创新与商业增长论坛》中,阿里云智能基础产品部副总裁,弹性计算&无影产品线总经理张献涛,发表了《云原生计算基础设施,加速互联网迈入智能时代》的主题演讲。
|
人工智能 资源调度 数据中心
智算中心纷纷“落地”,看国产AI芯片厂商如何以实践出新招,助力 AI 算力中心建设
智算中心纷纷“落地”,看国产AI芯片厂商如何以实践出新招,助力 AI 算力中心建设
251 0
|
存储 人工智能 运维
智慧算力的基础设施峰会:关注行业趋势、磐久2.0 正式亮相
智慧算力的基础设施峰会:关注行业趋势、磐久2.0 正式亮相
智慧算力的基础设施峰会:关注行业趋势、磐久2.0 正式亮相
|
机器学习/深度学习 存储 人工智能
HPC、AI与云计算:当智能时代三叉戟在亚马逊云科技完美融合
HPC、AI与云计算:当智能时代三叉戟在亚马逊云科技完美融合
364 0
HPC、AI与云计算:当智能时代三叉戟在亚马逊云科技完美融合
|
云安全 边缘计算 人工智能
人工智能、云原生、边缘计算趋势洞察|“2022 智能云边开源峰会”圆满举办
人工智能、云原生、边缘计算趋势洞察|“2022 智能云边开源峰会”圆满举办
414 0
人工智能、云原生、边缘计算趋势洞察|“2022 智能云边开源峰会”圆满举办
|
负载均衡 Cloud Native 安全
2022云管云网大会丨阿里云孙成浩:构建万物互联的智能云网络
2022年5月19日,由中国信息通信研究院(以下简称“中国信通院”)和中国通信标准化协会联合主办的“2022云管和云网大会”通过线上直播方式成功召开。大会以“新云管 新云网”为主题,工业和信息化部信息技术发展司信息服务业处处长张毅夫、中国通信标准化协会副理事长兼常务副秘书长代晓慧出席会议并致辞。阿里云受邀参加,并获得中国信通院颁发的2022年度混合云组网优秀案例奖。
857 0
2022云管云网大会丨阿里云孙成浩:构建万物互联的智能云网络
|
存储 人工智能 供应链
|
存储 数据采集 弹性计算
2022中国算力大会丨阿里云祝顺民:智能云网络,助力算网架构新探索
近日,由工业和信息化部与山东省人民政府共同主办的“2022中国算力大会”在济南举办。山东省委书记、省人大常委会主任李干杰,工业和信息化部党组成员、副部长张云明出席开幕式并致辞。阿里巴巴集团研究员、阿里云云网络产品线总经理&达摩院XG实验室负责人祝顺民在《新型算力网络,赋能东数西算》专题论坛发表演讲。
674 0
2022中国算力大会丨阿里云祝顺民:智能云网络,助力算网架构新探索
|
存储 机器学习/深度学习 人工智能
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能
212 0
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能