达摩院一年香,阿里巴巴CTO张建锋公布了哪些最新成果?

简介:

2018 杭州云栖大会,达摩院一年香,阿里巴巴CTO、达摩院院长张建锋公布了多项进展和新规划:构建4+X个实验室,覆盖全球8个城市;公布新计划,成立平头哥半导体有限公司,正式进入半导体产业;设立达摩院青橙奖,每位获奖者获得100万现金;启动全球数学竞赛,激发全球青年爱上数学,展现数学之美。

下面,让我们共同回到杭州云栖大会现场,聆听这场意义非凡的演讲:

43e21023a673dcbb22c76d2fef8d8ba8ba2676e1

阿里巴巴CTO、达摩院院长张建锋在云栖大会上

张建锋:大家好,非常高兴和大家分享达摩院过去一年做了什么。去年10月,我们正式成立了达摩院。很多人都关心一个问题:“达摩院到底是做什么?达摩院在做什么?达摩院做得怎么样?”我今天简单分享一下这个问题。

其实达摩院非常简单。达摩院就回答两个问题:这么多数据到底从哪里来的?我们是怎么处理的?

这么多业务,很多人都把任务扔到人工智能“黑盒子”里了,对达摩院来说,怎么样把这个“黑盒子”打开,真正解决所有人工智能面临的根本性问题,就是我们想要做的事情。

任何一个小孩出生,都要考虑他吃什么,正常成长过程怎样,这个我们也要做,所以我们也建立了组织架构。到目前为止,我们大概有300多位研究人员,在全球8个城市都有自己的研究分支机构。我们也建立了一系列实验室,分为主要的5个方向。这些方向也是根据怎么获取数据,怎么处理数据,让人工智能的发生变得更为容易而设定,包括技术、芯片,甚至背后支撑的基本研究,比如数学。

2fb7e9c1cf0cb0bf1851add4d2cccc9cc9cf5a16

今天我们怎么看AI?大家一般会提到AI的三大支柱,A(算法)、B(大数据)、C(计算力),阿里在此基础上还拥有两个优势,D(Domain Knowledge,业务场景)和E(Ecosystem,生态系统)。我们看人工智能的关键,就是解决ABCDE的问题。最核心的问题是三个,一是算法(A)、二是数据(B)、三是计算力(C)。我们发现,阿里不缺数据。阿里云,有工业大脑、城市大脑,有无数的数据要去处理。当然我们也要做一些数据获取的工作,最简单的,比如红绿灯。红绿灯数据,需要我们用非常复杂的方法获得:一个灯要发出光,我们用复杂的技术手段才知道这是红灯还是绿灯。今天我们要发展新的传感器技术,新的通讯技术,在车还很远的时候就知道红绿灯的情况。这些都要用新的传感器、新的芯片、新的通讯来获取,然后再去处理。

我们今天讲数字城市,城市要全部数字化意味着什么,数据会越来越多。然后就带来一个问题,我们怎么样高效地处理数据,这就是计算的问题。计算是个非常复杂的问题,我们怎么样低成本地把所有数据快捷计算出来,真正变成一个生产力。

今天,达摩院会更关注于底层算法算力和大数据处理。

为了做到丰富计算力,要获取丰富的数据,我们到底要做什么,这也是和芯片策略密切相关。我们做两类芯片,第一类是NPU,针对AI应用提高数据处理能力。我们达摩院成立以后,已经组建了一个团队,开始NPU的设计,计划明年流片,明年下半年就能拿到阿里巴巴第一款神经网络芯片。根据我们前期设计的初步评估,对现在图形处理有40倍性能功耗比提升。

第二,我们要做一些端上芯片,这么多端都要具有智能,都能够获取数据,处理数据,和传输数据。比如说,我们开发的嵌入式芯片CK902系列,是中国第一款带智联网安全功能的,完全的自主研发芯片。我们希望在数据获取和数据处理这两个领域做到真正的改变。

另外,我们面向未来做了量子计算。大家都知道,我们发表了“太章”,首次在全球模拟了81比特、40层随机量子链路模型。今天量子计算要变成现实,一要有芯片,二要有应用场景,所以在真正芯片出来之前,我们首先要有一个工具可以模拟量子计算,这个是全球最大规模的模拟系统。第二,我们正在建设自己的量子实验室,很快就会完成量子实验室建设。我们准备做自己的量子芯片,在两三年之内希望真正做一款出来。第三,我们根据阿里巴巴的优势,量子计算不仅要有芯片,要有上面的系统,也要上面的应用,端到端的。希望量子计算和经典计算在阿里巴巴平台上完美融合,充分发挥各自的优势,为人工智能真正提供一个无限的计算能力。

c5b447616e41ef3b56fba06e99d49df851e17d47

我们要做芯片,今天会成立一家半导体公司,名字就叫做平头哥。我相信很多人会问我为什么叫这个名字,我试着回答一下。阿里巴巴是一家使命驱动的公司,最大的使命叫做“让天下没有难做的生意”,帮助千千万万中小企业,我们内心非常相信小的力量。芯片是非常小的东西,我们希望它能够真正发挥巨大的力量。平头哥是什么?很多人知道非洲大草原上有一种很神奇的动物,蜜獾,天不怕地不怕,什么都敢做,也很讲究技巧和智慧。我们希望阿里巴巴刚成立的这家半导体公司,刚刚在做这个事情,能够学习这种精神,相信我们自己的选择和梦想。为了实现梦想,我们要持续负重前进,体现阿里巴巴重新创业的精神。

39a6c827086d29cd593cede8b5a4e30e16c7df11

达摩院有两个很重要的基础,一是青年人才,二是芯片,后面是人工智能下最最基本的基础,数学。今天我们会发布两个项目,第一个叫做达摩院青橙奖,我们在大陆、台湾和香港地区,有9个青年科学家,阿里巴巴每年会资助一部分人每人100万人民币做科学研究。第二,我们刚刚启动了阿里巴巴全球数学竞赛,昨天在网上正式公布。

27957043e160757a44191ef7ae904f380ab807b3

首批青橙奖获奖者合影

今天我们希望通过这样的活动让更多人关注青年科学家,这是中国创新技术的未来,我们也希望有更多人关注基础技术、基础学科的建设,特别是像数学这种和人工智能密切相关的技术。


原文发布时间为:2018-09-19

本文作者:以科技创新世界

本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”。

相关文章
|
存储 文件存储 对象存储
块存储、文件存储和对象存储特点对比
块存储、文件存储和对象存储特点对比
1167 2
|
7月前
|
Java 数据库连接 数据库
YashanDB JDBC驱动应用示例
本文来自YashanDB官网,主要介绍YashanDB的JDBC驱动安装与基础操作示例。内容涵盖示例环境(JDBC驱动、JDK、JRE版本要求)、安装前准备(JDK/JRE安装与验证)、JDBC驱动安装步骤(目录创建、软件包上传与环境配置)以及Java文件编写(连接数据库代码示例与编译执行方法)。通过本文,开发者可快速上手使用YashanDB的JDBC驱动开发应用。
|
8月前
|
缓存 安全 Java
《从头开始学java,一天一个知识点》之:字符串处理:String类的核心API
🌱 **《字符串处理:String类的核心API》一分钟速通!** 本文快速介绍Java中String类的3个高频API:`substring`、`indexOf`和`split`,并通过代码示例展示其用法。重点提示:`substring`的结束索引不包含该位置,`split`支持正则表达式。进一步探讨了String不可变性的高效设计原理及企业级编码规范,如避免使用`new String()`、拼接时使用`StringBuilder`等。最后通过互动解密游戏帮助读者巩固知识。 (上一篇:《多维数组与常见操作》 | 下一篇预告:《输入与输出:Scanner与System类》)
223 11
|
Java 编译器 Android开发
Kotlin语法笔记(28) -Kotlin 与 Java 混编
Kotlin语法笔记(28) -Kotlin 与 Java 混编
211 2
|
存储 监控 固态存储
如何在 Linux 上检查 SSD/HDD 健康状况?
【10月更文挑战第14天】
1370 1
如何在 Linux 上检查 SSD/HDD 健康状况?
|
12月前
|
人工智能 并行计算 监控
深入剖析 Qwen2.5 - 32B 模型在 VLLM 上的单机三卡部署与运行
本文深入探讨了Qwen2.5 - 32B模型在VLLM框架上的部署过程,从模型下载、启动命令、资源占用分析到GPU资源分配及CUDA图应用,详述了大模型运行的挑战与优化策略,强调了硬件资源规划与技术调优的重要性。
7104 2
|
11月前
|
机器学习/深度学习 人工智能 边缘计算
24/7全时守护:AI视频监控技术的深度实现与应用分享
本文深入解析了AI视频监控系统在车间安全领域的技术实现与应用,涵盖多源数据接入、边缘计算、深度学习驱动的智能分析及高效预警机制,通过具体案例展示了系统的实时性、高精度和易部署特性,为工业安全管理提供了新路径。
2860 7
|
机器学习/深度学习 人工智能 自然语言处理
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开
【10月更文挑战第20天】近日,开源版GPT-4o的发布成为AI领域的焦点。作为GPT系列的最新成员,GPT-4o在性能和多模态数据处理方面实现了显著提升,得到了知名AI专家Andrej Karpathy的高度评价。该模型的开源特性将进一步促进AI研究的进展。
967 3
|
存储 负载均衡 安全
使用阿里云解决云上数据保存的挑战
在数字化时代,数据成为企业重要资产,但快速增长的数据管理变得复杂。为此,作者选择了阿里云作为云上数据存储解决方案。阿里云凭借其高性能、高可靠和高安全的云存储服务,如对象存储OSS、文件存储NAS等,解决了数据保存问题。此外,阿里云的多副本和多机房策略确保了数据的可靠性和安全性,同时,丰富的存储产品线满足了不同场景的需求,帮助企业降低存储成本并提高数据访问效率。通过实施数据迁移、访问和备份恢复,作者成功优化了数据管理并期待未来与阿里云的更多合作。
425 8
|
机器学习/深度学习 PyTorch TensorFlow
ONNX 与量化:提高模型效率
【8月更文第27天】随着人工智能技术的广泛应用,模型部署变得越来越重要。为了在资源受限的设备上运行复杂的机器学习模型,模型量化技术成为了一种有效的手段。Open Neural Network Exchange (ONNX) 作为一种开放格式,支持在不同框架之间交换训练好的模型,同时也支持模型量化。本文将探讨如何结合 ONNX 和模型量化技术来提高模型的效率,减少模型大小并加快推理速度。
2287 2