智能无处不在,AI 开源创新的发展与探索

简介: 人工智能在今天的 IT 行业中可谓无处不在。如何将软件技术和人工智能结合,是行业当下的一个研究热点和发展方向。同时,人工智能的发展与开源事业是分不开的,中国已经将推动开源产业作为国家战略的一部分,也希望通过开源社区来推动人工智能技术向前发展。

人工智能在今天的 IT 行业中可谓无处不在。如何将软件技术和人工智能结合,是行业当下的一个研究热点和发展方向。同时,人工智能的发展与开源事业是分不开的,中国已经将推动开源产业作为国家战略的一部分,也希望通过开源社区来推动人工智能技术向前发展。

2022 年春节后,InfoQ《极客有约》的第一期节目邀请到了 OpenI 启智社区运营中心主任,CCF 开源发展委员会常务委员余跃老师,就“AI 开源创新的发展与探索”这一主题做了干货满满的分享。余老师师从我国软件领域顶级专家王怀民院士,毕业后一直从事开源软件相关的科研工作,对软件工程、云计算、人工智能和开源产业都有长期关注和深入理解。本期访谈,余老师结合他丰富的经历和思考,对人工智能开源创新事业的现在和未来进行了分析与展望。

OpenI 启智社区介绍

启智社区是在国家实施新一代人工智能发展战略的大背景,以及十四五期间开源成为国家战略的背景下诞生的。它是由科技部新一代人工智能产业技术创新联盟牵头,联合鹏城实验室、国防科技大学、北京大学、北京航空航天大学,以及华为、百度旷视等人工智能领域比较有影响力的产学研用单位和企业,发起的一个开源公益组织,希望通过开源的力量推进国家的人工智能技术发展。

OpenI 是一个开源社区,希望培育高水平的开源技术,汇聚国家从事开源项目的开发者和各个单位的力量。同时,通过社区也希望建立一个技术体系,从底层的芯片到系统软件、计算框架、智能算法与模型,以及模型的配套工具与应用,进而覆盖较为完备的人工智能技术栈。

人工智能创新道路上面临的挑战

今天的人工智能面临许多挑战。首先,人工智能正在从早期的单点型技术慢慢走向通用化,演变成基础设施类技术,从而产生各种各样的问题。从软件的视角来讲,人工智能和普通的应用结合起来后,会变成复杂的、智能化的软件系统。它可能比传统的软件系统更复杂,因为传统软件是基于确定性的组合,而目前人工智能模型以黑盒子为主,可解释性比较差。模型和模型之间、模型和代码之间,相当于确定性和非确定性之间组合起来,复杂程度就会高很多。

从智能的视角来讲,因为数据量在持续变大,所以怎样让模型具有终身学习、持续学习的能力,将模型技术和大数据结合起来,让模型自己成长演化,同样是一大挑战。

此外,不管是软件还是智能的视角下,一旦人加入到这个空间当中,人工智能和人机协作就会变得极其复杂。在重点应用中,这种人机协同的人工智能构造与保障技术就会显得极其重要。

关于人机协作,首先人工智能是要服务于人的各种需求。智能模型参与到人类活动中后,人类会给模型一定的反馈,这样的反馈如何被纳入到模型学习的过程当中,是需要模型自己来调整。行业内一个很有趣的项目叫终身学习机器,希望让机器学习技术以机器人的形式获得边学边做的能力,不断提升自身水平。这里涉及到一系列相关技术,比如模型在升级以后,通过什么样的数据重新训练可以增强它的能力,如果不能增强能力又该怎么评判、怎么回退、怎么去做版本管理等等。另外,如果模型本身越来越大,就要做剪枝压缩,方便在不同的平台上部署。总而言之,模型的能力应该是可演化的,这里有一些具体的问题要探索。

从目前的行业发展来看,小模型相比大模型更加适合人工智能的行业应用。因为小模型部署起来更简单,不像大模型那样需要大量的剪枝与压缩的成本。大模型在通用任务上可能会有更好的表现,所以未来大模型可能会更多扮演指导者角色,指导下游的小模型应用。未来大模型可能会更多发挥基础设施的作用,而较为节省资源的小模型则会在应用领域创造价值。

开源社区对人工智能发展创新的意义和帮助

今天的人工智能技术更多是黑盒的形式,因此开源首先是能够带来更好的安全性。其次,一项技术开源之后往往会有意想不到的场景应用,比如说火药当初是由炼丹师发明的,宋代用在烟花表演,后来逐渐在军事、工业等多种场景下应用。其实开源对于技术的促进作用正是加速了应用场景的丰富和快速演变,整个技术的发展方向可能会因为开源而完全改变。开源也是建立生态的必要途径,通过开源开放,可以吸引更多开发者参与到生态建设当中。

我国的人工智能底层技术相对来说根基比较薄弱,例如计算框架、芯片驱动、原创算法等等都缺乏成熟和流行的成果。我国在这一领域的研究主要集中在场景实现层面,更多是短平快见效的技术。在基础研究领域,国内缺少一些长期投入和创新,需要国家和行业共同努力来改变现状。

OpenI 启智社区的初衷,就是通过建设我国自主的开源社区,帮助国内人工智能产业走上全面发展和创新的道路。从技术层面来讲,启智社区会服务开发者做一些工具,尝试将软件工程的一些工具和能力通用化,变成平台类的技术,打造更好的开发环境。在运营层面,社区则希望通过大量投入来发掘国家的开源力量。比如说启智社区有一个启梦行动,通过科技部重点专项资金激励开发者,对真正为开源技术有贡献的启智开发者承诺三年不低于一千万的资金支持。社区也通过一些大赛来培育相关技术,比如说每一年鹏城实验室的全国人工智能大赛都有一百万奖金,希望鼓励开发者去解决一些实际的问题。在生态层面,社区希望合作伙伴的一些技术能服务到开发者,开发者也能参与到他们的项目当中。比如说社区跟 Linux 基金会有非常深度的合作,希望启智孵化的一些项目未来能得到 Linux 基金会认可。

启智社区为开发者提供的资源

对于人工智能行业的个人开发者与初创企业来说,他们面临的最大挑战往往是难以获取学习、研究和开发人工智能技术所需的各类资源,包括基础设施、算力、数据、实验环境、运营资源等等。为此,启智社区希望搭建一个高水平的平台和技术体系,在此基础上在底层提供公益性的开放资源供公众使用。一方面,这样的支持可以促进国家人工智能生态的建设;另一方面,平台上的很多项目也需要开发者支持,开发者在使用资源的过程中也会促进项目和平台的良性发展。并且启智社区本身就是依托鹏城实验室这样的国家新型科技战略力量,服务社会也是启智社区的责任和义务。

具体来说,启智社区提供的公益资源包括:

基础设施。包括代码管理平台、模型开发工具、TB 级数据托管,使开发者能将代码和数据一键加载到社区提供的开放算力环境下,去调试和一部分的模型训练。

运营资源。包括像 InfoQ 这样的机会,社区希望能源源不断输出技术大咖和 InfoQ 合作;又比如 CCF 在 2021 年底成立了开源发展委员会,希望能通过学术界的力量一起构建开源生态。

实验环境。社区底层提供了一些异构基础设施,里面有各种各样的芯片。开发者不同的算法和模型在这里可以有一个很好的实验场,在开放的实验环境中验证想法和理论。

技术伙伴。启智是组织各方力量共建的社区,内部来自高校的、来自企业的技术伙伴,提供很好的交流氛围。

当然,启智社区为公众提供的资源中价值最高的可能就是庞大的公用算力了。社区提供的算力主要依托于鹏城实验室。鹏城实验室有一个名为鹏城云脑的人工智能大集群,也叫科学装置,分为鹏城云脑一号和二号。一号是纯英伟达体系,可提供百 P 级的 AI 算力。云脑二号是同华为联合打造的纯国产集群,算力达 1024 P flops,也就是 E 级 AI 算力。集群有 4096 颗昇腾芯片,可以为社区提供一些共享算力。当然不是所有算力都通过社区开放,有一些是学生实习,或者联合研发可以用到的。

启智社区还在探索算力网络的形式,希望能把各个层面的人工智能算力充分利用起来,能各种任务在更适合的计算集群上运算,提升整体效率。算力网络也能提供更广阔的实验场,其中有各种各样的算力和软件体系。目前社区已经连接了一部分计算中心,正在搭建智能算力网络的基础环境。

“东数西算”政策背景下的社区规划

国家正式发布“东数西算”政策后,启智社区也做了相应的规划和探索,希望能将分布在全国的传统超算中心、智能计算中心、通用数据中心、云计算中心等等算力中心联合起来,充分利用空闲资源。基于这些资源,启智社区希望构建一个技术体系,使得这些计算中心广域互联后能有更好的任务调度,将任务分配到更合适的算力资源上来提升效率。社区还在探索通过分布式学习、联邦学习等方式,在保持数据本地化的前提下利用各个中心的算力资源,从而解决数据量过大、隐私要求严格等挑战。

目前社区同华为有很深层次的合作,计划首先将华为在武汉、西安、成都的算力中心,加上北京大学人工智能学院等单位的七八个集群与鹏城云脑联合起来形成智算网络实验床。社区正在探索跨域学习适用的算法、模型和应用,以及对应的优化技术等等。从算力网络的角度来讲,东数西算更多希望将任务和数据调度到西部地区。因此启智社区希望提供一个实验环境和一些技术探索,为这个工程贡献更多支持。

启智社区的开源项目和其他开源社区推荐

目前启智社区有七千多个各种各样的仓库,里面有很多来自高校的老师、学生做的实验算法或模型。一些知名单位、学术研究小组也会把他们的一些项目以组织的形式放在社区内分享,供大家学习交流。

社区内一些优质项目包括了鹏城实验室同华为合作的开源鹏程·盘古大模型项目,以及围绕盘古模型的众多相关技术。还有 TCL 研究院将深度学习跟工业质检结合起来的一个名为 READ 的开源项目。更有意思的一些前沿交叉项目包括北京大学在做的脉冲神经网络 SpikingJelly 等等。社区内未来还会开源更多应用场景的开源项目,例如新冠靶向药研究、蛋白质分析等等。

除了启智社区外,人工智能行业也有很多活跃和高水平的开源社区。例如 Linux 基金会下面有一个 AI&Data 子社区,积累了很多有用的技术体系。另一大活跃社区是 CNCF,输出了几乎所有主流的虚拟化技术。

在国内,知名社区包括 Paddle 飞桨的独立社区(飞桨也是启智项目的一部分)。百度也在维护一个不错的开源 AI 社区。此外还有华为昇腾、龙蜥社区、优麒麟、开源社等社区,都是值得推荐的。

人工智能开源领域未来的发展趋势

相对于通用技术来讲,人工智能还属于专业技术类型。未来人工智能大模型会逐渐成为基础设施,行业会在这个基础设施上面去做更多的研究和创新。

人工智能大模型的技术也在不断发展。首先在算力层面,大模型的算力成本还是很高的。即使算力足够,要充分利用这些算力也并非易事。这就需要软件技术与 AI 技术结合发展,做好算力和数据的平衡。

大规模数据集还会涉及到很多隐私相关的问题,乃至技术伦理的问题,这些也是人工智能技术发展过程中需要重点考虑的。例如国内就有很多单位企业在做数据安全保护相关的工作,希望通过一些机制来保障模型开发过程中的数据安全性。

当人工智能大模型演化成基础设施,对云原生等相关技术和配套设施、接口也会有很大的推动作用。未来大模型会更多同传统软件技术和代码结合起来,从而提升系统的复杂性,并对系统自进化能力提出更高的要求,这些都是需要克服的挑战。例如,一个大模型可能需要非常庞大的硬件计算资源,这些资源与云原生技术结合后,如何更好地为大模型提供服务,更好地满足不同开发者的个性化需求,都需要行业进一步探索研究。

总结与思考

在本次分享中,余老师还从更高的视角上谈到了启智社区的存在意义。余老师提到,启智社区体现了一种家国情怀,社区成员都是怀抱着这种情怀聚集在一起的,而不是把它单纯地看作是某种工作或义务。随着开源变成国家战略,国内开源产业不再像国外经典的开源社区那样从一开始完全是由兴趣爱好推动的。

所以,在启智社区,人们更多希望通过家国情怀、战略情怀,利用开源技术去解决一些国家层面的问题。余老师也希望更多技术行业从业者和爱好者能够加入到启智社区中,共同将这一国家级开源社区做大做强,使启智成为中国代表性的人工智能高水平社区,为国家的人工智能产业发展带来更多助力。

了解更多软件开发与相关领域知识,点击访问 InfoQ 官网:https://www.infoq.cn/,获取更多精彩内容!

目录
相关文章
|
16天前
|
数据采集 存储 人工智能
代理IP与AI自我进化:探索未来智能的新边界
在AI快速发展的今天,数据获取成为制约其进步的关键因素。代理IP技术通过匿名性和灵活性,帮助AI突破地域限制、绕过反爬虫机制,提升数据质量和模型训练效率,促进AI自我进化。本文通过实例和代码,探讨了代理IP在AI发展中的作用及潜在价值,强调了合理使用代理IP的重要性。
23 1
|
11天前
|
机器学习/深度学习 人工智能 UED
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是一款开源的AI虚拟试衣工具,能够智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。该工具支持半身和全身试穿模式,操作简单,适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。
95 27
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
|
4天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
36 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
11天前
|
机器学习/深度学习 Web App开发 人工智能
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
Amurex是一款开源的AI会议助手,提供实时建议、智能摘要、快速回顾关键信息等功能,帮助用户提升会议效率。本文将详细介绍Amurex的功能、技术原理以及如何运行和使用该工具。
65 18
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
|
9天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
89 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
5天前
|
人工智能 数据库 自然语言处理
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
「拥抱Data+AI」系列文章由阿里云瑶池数据库推出,基于真实客户案例,展示Data+AI行业解决方案。本文通过钉钉AI助理的实际应用,探讨如何利用阿里云Data+AI解决方案实现智能问数服务,使每个人都能拥有专属数据分析师,显著提升数据查询和分析效率。点击阅读详情。
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
|
2天前
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
21 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
Meta AI推出的Llama 3.3是一款70B参数的纯文本语言模型,支持多语言对话,具备高效、低成本的特点,适用于多种应用场景,如聊天机器人、客户服务自动化、语言翻译等。
62 13
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
|
10天前
|
人工智能 安全 PyTorch
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
SPDL是Meta AI推出的开源高性能AI模型数据加载解决方案,基于多线程技术和异步事件循环,提供高吞吐量、低资源占用的数据加载功能,支持分布式系统和主流AI框架PyTorch。
43 10
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
|
10天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
57 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
下一篇
DataWorks