阿里巴巴达摩院也正在构筑一座知识大厦。2021年12月,达摩院连续第四年发布前沿科技趋势预测。
达摩院分析了770万篇公开论文、8.5万份专利,覆盖159个领域,通过“定量发散,定性收敛”的分析方法,挖掘其中热点及重点技术突破,深度访谈近100位科学家后,总结得出《2022年十大科技趋势》:AI for Science、大小模型协同进化、硅光芯片、绿色能源AI、柔性感知机器人、高精度医疗导航、全域隐私计算、星地计算、云网端融合、XR互联网——代表了正从实验室走向产业应用的技术趋势,也是当前社会的真实需求。本文选取12位领域专家对这些趋势的前沿洞察和研究落地的深入思考。
AI for Science
人工智能成为科学家的新生产工具,催生科研新范式。
鄂维南(中科院院士,北京大学、普林斯顿大学教授):数百年来,数据驱动的开普勒范式和第一性原理驱动的牛顿范式就是科学研究的两大基本范式,AI for Science有可能促进两种范式的深度融合,激发新的科学革命。
要适应新环境,科学家要更深入了解AI,积累大量AI能力和资源的企业也要为学界提供稀缺资源和基础科研工具,双方秉持开源开放的精神才能打造AI for Science科研共同体。
吴飞(浙江大学人工智能研究所所长):我们正处于数据密集型计算范式年代,科学家在海量数据里探索,人工智能因此一定会成为科学工具。这代表着计算思维的渗透,科学家要培养以设计、构造为核心的计算思维。
比如AlphaFold不仅仅是利用了深度神经网络作为工具,还因为聚集到不同学科科学家,并设计了明确的可计算思路才解决了从氨基酸序列到蛋白质三维空间结构预测的难题。
华先胜(阿里巴巴达摩院城市大脑实验室负责人):目前AI for Science已有点状突破,这些成绩的取得不外乎两种方式:要么是AI专家了解科学问题,要么是科学家学习AI技术,这跟AI for Industry相同,只不过AI for Science门槛更高。
和改变产业相似,AI助力科研也基于两个条件——数据和计算,数据量大质好、问题依赖大规模计算的学科,能更好地应用AI技术挖掘数据中的“玄机”,解决重要的科学问题。
目前,计算助力科研正走向智能助力科研。之后,AI for Science会走向平台,AI专家与某领域科学家一起建造平台,研发更强大、更自由的工具,让批量研究变成现实。
AI for Industry从单点到平台后,就走向协同进化系统,平台解决规模化的能力生产和应用落地,系统化则长久、持续、深入地解决行业问题。
印卧涛(阿里巴巴达摩院决策智能实验室负责人):在DeepMind与合作者最近发表的论文中,作者猜测低维拓扑中存在未知非线性关系,并用很多数据和神经网络拟合了近似函数,结果发现其中三个量作用巨大,只用这三个量也拟合得很好。通过反复实验,数学家最终猜出一个不等式并给出证明。
自古以来,开普勒等应用科学家反复实验并从中寻找规律,现在AI算法和AI专家扮演了类似角色。延伸到AI for Science,我认为AI能加速科学实验。除计算机模拟外,AI可以告诉大家新方向,AI最近就在优化太空望远镜指向,搜集更多、更有趣的数据,加快了规律发现。
其次,AI会推动人机结合,数据生成、构建神经网络和训练、利用神经网络进行结果验证等高度相关的工作都将因此受益。
最后非常重要的是发展可解释的AI工具,只有这样AI才能获得科学家的信任。
黄非(阿里巴巴达摩院语言技术实验室研究员):面向工业的人工智能和面向科学的人工智能有些不同:前者主要根据真实世界数据寻找模式并解决工业实际问题;后者不仅要找到数据中的模式,还要找到底层规律并解释现象。
但特定领域的知识表述涉及符号逻辑,包括知识图谱,甚至人的经验、文本知识,如何对于领域知识进行表述和应用,目前AI在这方面工作相对比较有限。
另一个问题是跨团队合作。目前模式是科学家提出问题和需求,由AI专家辅助解决,更有效的工作是双方各迈一步,AI专家深入了解相关学科知识,科学家也更好了解AI技术趋势。
大小模型协同进化
大模型参数竞赛进入冷静期,大小模型将在云边端协同进化。
周志华(南京大学计算机科学与技术系主任、人工智能学院院长):大模型未来会在事关国计民生的重大任务上发挥作用,而在其他场景下或许集成学习手段利用小模型更有优势,尤其是通过很少量训练来“复用”和集成已有小模型。
我们提出了一个叫作“学件”的思路,假设很多人已经做了模型并且乐意共享,通过建立规约来组织和管理学件,以后的人再做新应用时就可以不用从头收集数据,可以先利用规约去市场里找找看是否有比较接近需求的模型,然后稍微打磨即可。
模型也能利用常识和知识,结合逻辑推理和机器学习。逻辑推理善于利用人类知识,是严密的基于数理逻辑的“从一般到特殊”的演绎过程;机器学习善于利用数据事实,是不那么严密的基于概率的“从特殊到一般”的归纳过程。如何让两者有机结合是个重大挑战,已有探索大多倚重一方同时引入另一方,我们最近在探索二者的相对均衡互促利用。
唐杰(清华大学计算机系教授,北京智源人工智能研究院学术副院长):虽然超大规模预训练模型取得了较大进展,但还有很多问题亟待解决。预训练模型的理论基础尚未明确,构建大模型还要克服数据质量、训练效率、算力消耗、模型交付等诸多障碍,大模型还普遍缺乏认知能力,这也是部分学者质疑这类模型能否成为“基础模型”的原因。
模型参数不排除进一步增加的可能,但目的是探究性能提升的可能。大模型研究要注重架构原始创新,通过模型持续学习、增加记忆机制、突破三元组知识表示方法等提升万亿级模型的认知智能能力。在模型本身,多模态、多语言、面向编程的新模型也将成为研究重点。
大模型使用门槛将大幅降低,促进中小企业形成“大模型+少量数据微调”的AI工业化开发模式,降低算力消耗、提升千亿以上参数规模模型推理速度两个数量级并搭建一站式平台提供在线模型构建部署、应用发布等全流程预训练服务,支持上千个应用的开发与部署。
杨红霞(阿里巴巴达摩院智能计算实验室科学家):预训练大模型还有亟待突破的几个课题:一、目前的主流实践是先训练大模型,再基于下游任务通过剪枝和微调压缩模型,在基本不损失精度的情况下减轻部署压力,直接训练小模型就能得到较满意精度的办法还没有;二、训练千亿、万亿模型动辄上千张GPU卡,对大模型的推广和普惠带来了很大挑战;三、模型在预训练阶段如何与结构化数据结合进行更有效的认知推理也是非常大的挑战。
大模型参数竞赛因此会进入冷静期,而大小模型在云边端协同进化带来了新的可能。这让小模型更容易获取通用知识与能力,并通过极致优化提升效率,解决大模型数据集过于单一的问题,全社会也不需要重复训练相似大模型,让算力与能源使用效率最大化。大小模型的协同进化也可以更好服务于复杂的新场景,同时对用户数据隐私提供更好的保护。
硅光芯片
光电融合兼具光子和电子优势,突破摩尔定律限制。
周治平(北京大学教授,上海光机所特聘首席研究员):人们对电子、光子的认识,以及由此产生的技术更迭,带来了信息社会的出现及发展,而信息社会对小巧、廉价、低能耗器件和系统的偏爱催生了各种各样的半导体芯片。最早的微电子芯片得益于硅材料和CMOS器件的结合,尺寸小、成本低、集成度高,是全球经济不可分割的一部分,但其发展速度也趋缓。
光电子芯片注重光子与电子的相互作用,拥有多通道、大带宽、高速率的特点,是支撑高速通信的关键。但由于砷化镓、磷化铟的使用,这类芯片很难同时实现低成本和高度集成。
硅光芯片通过将光电子器件硅片化,使光电子芯片实现成本和集成度上的突破,提高数据中心内集群之间、服务器之间乃至芯片之间的通信效率。
硅光芯片的下一步是硅基光电子芯片,利用集成电路的设计方法和制造工艺,将微纳米的光子、电子及光电子器件异质集成在硅衬底上,形成具有综合功能的大规模光电集成芯片。
绿色能源AI
人工智能助力大规模绿色能源消纳,实现多能互补的电力体系。
周二专(中国电科院首席系统架构师):绿色能源的大量接入,令大电网呈现出复杂的非线性随机、多状态变量耦合及多时间尺度动态的特性。同时,特高压交直流工程的发展建设,使系统形态及运行特性日益复杂,在特高压交直流之间、特高压直流的送受端电网之间,耦合关系都非常复杂,监控断面数量日益增加,控制规则日趋复杂。因此AI在新型电力系统运行中具有广阔场景,电科院也开展了以下几方面工作。
一、目前电网完整的在线分析流程需要5--7分钟,但电网动态过程以秒级速度变化。因此,中国电科院构建了电网数字孪生模型,能以毫秒级速度实时追踪电网运行,为电网分析提供毫秒级延时、高保真的潮流断面数据,为下一代电网调控提供了突破性技术支撑。
二、目前调度控制仍以经验为主,但现代电网运行动辄就涉及几十甚至上百种运行策略,构成巨大挑战。中国电科院采用数字孪生和决策图谱等技术实现了调规数字化和所有运行方式的全面毫秒级监测,有效降低连锁故障风险。
三、随着电网稳定控制难度骤增,基于离线分析的日前方式安排、日内方式调整已经难以适应。中国电科院基于数字孪生与调规数字化,开发了电网运行方式滚动推演系统,推动运行方式计划的校对、核验由离线计算人工决策到在线智能化转变,确保复杂大电网的可靠供电。
总体来说,新型电力系统实现智能调控、运行推演,离不开AI技术,在AI技术支撑下构建多个物理电网和应用程序交互的数字孪生体,每个数字孪生体解决某一场景下的电网运行问题,足够多的孪生体构成电网调控数字孪生系统可以解决各类问题,实现智能调控。
全域隐私计算
破解数据保护与流通两难,隐私计算从小数据走向大数据。
任奎(浙江大学网络空间安全学院院长):隐私计算在完成计算任务的同时实现了数据隐私的保护,是基础性的安全技术。
隐私计算不是某个单项技术,而是包括1982年提出的安全多方计算、后来的同态加密、可信计算、差分隐私等在内的一整套技术。但因为性能开销和实际使用难度过大,隐私计算在早年不被认为具有实用价值。最近,随着硬件加速和软件创新的发展,其应用化趋势才得以凸显。我们目前重点关注安全多方计算、差分隐私、数据脱敏,这三个方向都会有令人期待的技术突破和实质性场景落地。
星地计算
卫星及地面一体化的通信与计算,促进空天地海全面数字化。
张铭(阿里巴巴达摩院XG实验室负责人):随着低轨卫星低时延、低成本的优势不断凸显,全球正处于卫星互联网发展的上升期,云计算、通信技术与卫星互联网组合而成的星地计算在未来将成为全新一代的基础设施。
当然,星地计算的规模化发展仍涉及不少核心技术。要以场景需求和商用价值为导向,从技术突破和解决工程问题等角度出发,才能设计高性能、低成本、适应多样场景的商用产品。工程师必须设计出新型毫米波的相控阵天线以及相应的波束赋形控制算法,用较低成本满足性能要求,还要设计新型星地通信协议满足卫星互联网多用户、移动性、复杂动态业务需求,终端集成和优化方面也还存在很多问题需要解决。
本文摘自《云栖战略参考》2022第一期,订阅数字化转型双月刊《云栖战略参考》请扫码(或填写下方链接),工作人员会在审核后为您寄出
https://survey.aliyun.com/apps/zhiliao/xsTiZ4YaM