构建成长式开源生态:挑战和未来 | 2024龙蜥大会

简介: 本次分享的主题是构建成长式开源生态:挑战和未来 | 2024龙蜥大会,由北京大学计算机学院教授、副院长,中国计算机学会开源发展委员会副主任周明辉进行分享。主要分为三个部分:1. 开源挑战2. 研究路线3. 未来愿景

构建成长式开源生态:挑战和未来 | 2024龙蜥大会

内容介绍

1. 开源挑战

2. 研究路线

3. 未来愿景

 

image.png

非常荣幸有这个机会参加龙蜥操作系统大会并做分享,我接受到这个邀请表示非常的惊奇,因为我就是北京大学一名普普通通的科研和教育工作者,一直在做开源研究。既然对于阿里这么一个重要的大会邀请一位开源研究工作者来做报告和分享,我觉得这的确表达了今天是中国历史上的确迎来开源发展的最好时代。也许最好时代还在未来,但回顾历史今天是我们的最好时代。接下来我将分享构建成长式开源生态:挑战和未来。以下是我的三个内容。

image.png

 

01.开源挑战

首先来讲开源挑战。我们今天讲不仅仅是开源,而是开源生态已经在驱动全球科技创新。

image.png

因为开源生态几乎把开源软件创新所有要素都卷入到了生态之中,汇聚了千万计的开发者和数以亿计的开源代码仓库,是当前全球科技创新的重要引擎。可以看到,在整个生态中以开源项目为核心,有开源社区汇聚千万英明神武的共性者,甚至来自企业的惊才绝艳的、共性的、还有无数的组织和联盟才使得生态能以全球化的方式得以持续发展。在最下面是开源代码托管平台,国际上最大的  Git Hub  ,国内  Gitee  号称是最大的,我们可以看到它们两者之间的差距是在一个数量级。

image.png

站在今天这个时代节点,我们可以看到开源生态不仅仅是产业创新重要的一个资源,它也成为国家战略资源。尤其在今天,在地缘政治局势也成为一个不可忽视的重要的发展方向的时候,我们可以看到虽然开源是国际化的,但是开源生态它已经成为事实上的国家做战略部署的一个重要的战略资源。可以看到像美国的一些动作,它的确是我们目前站在产业创新发展上不可忽略的一些活动。我们除了自强自立,同时一定要有全球化的视野,才是我们能领导国际化创新产业的必要条件。

image.png

对于我国来讲,开源生态也已经成为国家重要战略。前面王院士也再三提到开源在国家十四五规划和 2035 年远景目标纲要上,开源战略已经成为战略任务。

image.png

今天之所以有龙蜥操作系统大会,其实也说明我国国产开源要素已经成型,从重要的开源项目到积极参与开源的企业,再到开源组织包括开放原子基金会、我们的计算机协会、开源发展委员会以及北大清华国防科大、包括像浙大、陈院士,都已经成为开源发展的重要力量。作为我国这么大体量,我们想要形成全球化生态,甚至能够引领全球产业创新发展,我们是非常需要有效的方法。

image.png

那什么是方法呢?回顾开源四十年的发展已经形成了非常成功的生态构建方法。我们可以看到经典方法有两种,一种我们认为是自由是开源生态构建,另外一个不能讲垄断,因为有同仁对这个词非常的有意见,但它其实是大企业主导的开源生态构建。自由式和大企业主导式都有它各自的特点和优点。今天前面各位领导和老师们都已经讲到了,站在今天面临新的非常多的一个挑战,其实主要体现为万物互联以及 AI 给我们带来的一个机会,今天互联网可以说已经发展到了前所未有的复杂的状态,因此对于开源来讲,主要是这三个方面。第一个就是开源生态的持续治理,这个面临的主要的问题就是开源生态它的边界非常开放。龙蜥今天可能是一万个节点到明天也许就能到两万个节点,那么彼此的关系也是非常复杂和不可测的。那么怎么持续治理,这是整个开源生态面临的第一个挑战。第二,社区我们经常讲 Community Over Cold 是因为对于开源项目开源生态来讲,那一群人能够使得项目生态能够持续运转至关重要。对于社区来讲,他参与的主体个体企业机构非常的变化多样,并且在持续演化。因此对于这个社群来讲我们怎么能够面向全球,能够吸引到惊才绝艳的个体贡献者和大厂投入资源?怎么去激发?这也是当前开源社区面临的非常核心的挑战之一。第三,开源软件供应链已经再全世界成为非常热的一个关键词之一,归根结底就是只要互联网存在代码复用完全不可避免。这就形成了今天开发任何软件软件包软件代码,它之间存在错综复杂的依赖关系,就构成了覆盖全球的开源软件供应链企业牵一发动全身,目前它的风险防控对于全世界任何国家任何机构都是非常具有挑战的,几乎没有一个最好的解决方案。这也是为什么今天就可以看到各国都在积极的寻求有效的解决方案。这个我们叫第三个挑战开源制品的可信保障。

image.png


02.研究路线

我们从来都讲产学研融合,为什么讲融合?其实是因为产学研是有各自的特点,我们显然各自都是有差异的,因此我们才讲到融合。为什么这么讲,因为我今天来跟大家讨论应对上述挑战的研究路线,只是说从我学研研究者的角度来看整张视图它应该是以怎样的方式往前推进。那么我们讲研究路线图,国际已经有非常有效的开源生态,这个我们可以看得到,包括像安卓甚至 AI 大元模型等等。国内像今天我们的龙蜥操作系统,这是由我们自己的文化基因在,这是我们国内的开源生态系统。从研究路线上来讲,我们希望能够对生态要素做特别精细和体系的度量和刻画。在此基础之上对开源生态的成长演化模型,进行各种技术方法的一个度量评估,在这个基础之上突破我们刚才讲到的三个关键技术,在此基础之上在构建成长式融合型开源生态基础设施。这个就是一个产学研融合的一个生态,就未来构造开源生态而形成的生态。

image.png

从我学研的角度上来讲,我们的研究方法就是数据驱动的开源生态的度量和智能化支持,面向的就是开源大数据不仅仅是代码,还有在整个互联网上整个人类留下的开发开源软件以及社区活动的所有数据,我们对此进行挖掘分析度量,进而对整个开源生态的开发维护提供智能化支持。

image.png

因此我在这里也希望能够给大家一个非常细节的角度来看。对于我学研间来讲,我们看开源生态目前在做怎样一些工作,也希望借此机会能够碰撞产学研融合。比如说在开放式过程治理方面,我们会去研究多实体协作竞争,因为前面讲到开源生态它显然是一个非常复杂的系统。在这个复杂系统中,个体、企业、基金会、像 CF 这种组织在其中扮演的角色到底是什么,它会做什么事,他为整个产品最后高质量的发展做什么样的活动和任务,它是一个复杂系统,我们怎么去做精细的度量,从数据支付,在借鉴各种统计分析和自动化方法。这里我们也有我们相应的一些研究成果,包括对经典的开源项目做研究会,发现它与商业模式出发,能够建立的开源商业参与模式以及不同的企业之间,它的合作的模式是什么,企业他做什么事对贡献的社区它带来的影响是什么。

image.png

这方面的研究其实对于全世界学术社区来讲。我们有引领开源三月参与研究方向。而对于多元化社群激发来讲,目前我们聚焦的一个问题就是面对莘莘学子们进入到复杂社区是非常茫然的,因为任何一个任务对他来讲都是复杂的。我们讲就新手进阶式融入,怎么去提供精细的有效的一个支撑,比如说我们会先从任务的性质和特征出发去批出来到底什么样的任务去匹配什么样的,在此基础之上再去做智能化的分析和推荐。

image.png

其实我们整个国际学术界区在这方面都有一个研究的,在国际开源社区中,我们可以看得到就开源项目,对此这一类的工作也是非常激动和态度积极的。像这些我们都有提供部署在互联网上的一些工具,但凡我们做一项研究,我们都希望能够把它部署到互联网上,在某种程度上能够鼓励更多的人来参与和推进这个方向。但是像这些部署的工具是没有办法跟企业界直接面向用户来使用的一个技术和工具相比,这就是产学研融合,可以达到更好的效果。

image.png

前面讲到可信软件供应链是在全世界今天都是非常重要的一个主题,对于我们来讲也是相对复杂供应链,任何事情先从具体的开始做我们才能做到深入才能做到深入的体系化。因此对于软件供应链来讲,我们也是先从最基本的选择一个复杂的供应链来继续分析节点和节点之间它的依赖关系,建立相应的一个复杂供应链模型,在这个基础之上,再去分析供应链的特征演化。就比如说我们对深度学习软件供应链有深入的一个分析。

image.png

在此基础之上就跟今天软件供应链建模是不够的。建模我们只是去理解它的一个特征,在这个基础之上,我们是需要对复杂的供应链风险进行检测和防控。比如说我们有一个工作是对生态里边的合规不兼容进行检测和消解,提供 SMT 求解器,一个全局合规性风险消解方案。这个我们英明神武的同学也把相应的功能部署在了网络上,大家如果有兴趣也可以进行相应的一个了解。

image.png

相关的研究也是引领开源软件供应链研究,对于我们来讲我们会很骄傲在全球学术界我们做了很好的工作。

image.png

但是在产学研融合上,我们可以怎么更好的去推进整个开源生态的一个前行,这个需要产学研,大家能够有效地建立各自的一个接口,使得开源生态基础设施能够有效的建设和部署直至推进我们整个中国开源项目和开源生态的成长。

 

03.未来愿景

关于未来愿景,前面讲到目前的开源生态构建方法主要是两个维度,一个是自由式,一个是大企业主导式。

  image.png

这两种都有各自的优点和特点以及缺点,在这两者之间都蕴含了一个成长式生态构建,它会更有效地考虑到开放式过程治理中怎么去支持可配置的治理策略以及怎么能够支持政府企业和大众,它的一个良性的博弈。因为迄今为止可以说国际国内的大家都会遇到很多的难题,因为时间有限,我在这里不做过多的一个阐述。但对于成长是生态构建来讲,核心思想就是怎么能够把有效的生态构建的方法以精细的、不同的角色之间有能够可见的 API 的方式,大家能形成合力往前推进。

image.png

对于我们的愿景来讲,尤其站在历史的今天和中国本土的经验,首先第一条我们是希望能够发展零到一的创新,这也是作为学术界会经常受到的一个诟病,讲我们中国本土现在跟国际的社区来讲,我们的学术创新,甚至能够最后引导到产业创新这些土壤以及最后形成的技术在哪里。我们会有一系列的考虑。具体的就是希望能够支持科研成果开源发展,加速成果转化,甚至来支持开源教育。因为其实对于我们中国本土最大的一个能力来源,就是我们有非常多的人才积累,但怎么把这些人才积累把它放到我们想要的方向去发展,这个其实是有很多的思考和工作可以做的。

image.png

第二方面也是最后一个方面,就是我们希望产学研融合,能够建设全球化的开源创新生态。那么这里的一个重点也是产学研融合,为什么讲融合?产学研是有不同的角色和能力在的,您要求我去做产业的任务,我觉得这个是不合适的,因此我们能够让这个开源生态更好就是大家怎么能够界定自己能够做的最好的任务,然后建设好 API ,就真正能够有利于本土以及能够推进全球化创新的开源生态。谢谢各位,这就是我的分享,非常感谢!

相关文章
|
传感器 5G UED
5G 标准化进程|带你读《5G空口特性与关键技术》之二
从 2016 年起,3GPP 启动了 R14 研究项,目标是在 2020 年实现 5G 的商业化部署。为此,3GPP 采取了按阶段定义规范的方式。第一阶段目标是R15,旨在完成规范 5G 的有限功能。第二阶段是 R16,旨在完成规范 IMT-2020 所定义的所有功能,将于 2019 年年底到 2020 年完成。
5G 标准化进程|带你读《5G空口特性与关键技术》之二
|
10月前
|
人工智能 运维 Linux
进化、重构、赴未来,龙蜥加速推进产业面向AI时代变革 | 2024龙蜥大会主论坛
在2024龙蜥大会中,本次分享的主题是关于英特尔公司与龙蜥社区的合作成果和未来计划。 1. 龙蜥操作系统开源社区取得的关键性的进展 2. 社区治理 3. Anolis 23:面向AI时代,IT基础设施全新底座 4. 面对机遇开源共创,服务用户聚力前行 5. 面向AI时代,龙蜥社区发布三大计划加速生态建设 6. 展望未来
197 5
|
10月前
|
机器学习/深度学习 人工智能 编解码
《AI助力图形渲染:抗锯齿性能的飞跃之路》
在图形渲染领域,锯齿问题一直影响视觉效果。AI技术通过多种方法提升抗锯齿性能:1) 基于深度学习的超分辨率算法,如NVIDIA DLSS,提升图像分辨率和平滑边缘;2) 多帧分析与合成技术,融合多帧信息减少锯齿;3) AI材质与光照模拟,精准计算反射和折射;4) 场景理解与自适应采样,智能调整采样点;5) 强化学习优化渲染策略。这些创新方法将显著改善图形渲染质量,带来更逼真的视觉体验。
303 5
|
5月前
|
测试技术 程序员 Go
Go语言测试简明指南:深度解读go test命令
总的来说,go test是 Go 语言中一个强而有力的工具,每个 Go 程序员都应该掌握并把它融入到日常的开发和调试过程中。就像是一个眼镜过滤出的太阳,让我们在宽阔的代码海洋中游泳,而不是淹没。用好它,让我们的代码更健壮,让我们的生产力更强效。
409 23
|
11月前
|
人工智能 监控 安全
自学记录鸿蒙 API 13:实现人脸检测 Core Vision Face Detector
本文介绍了基于HarmonyOS Next API 13中的Core Vision Face Detector API实现人脸检测小应用的过程。通过研究发现,该API不仅支持人脸检测框的定位,还能识别关键点(如眼睛、鼻子和嘴角位置)及人脸姿态信息。文章详细记录了开发历程,包括项目初始化、权限配置、图像加载与人脸检测、用户界面设计,以及性能优化和功能扩展的思路。应用场景涵盖身份验证、照片管理和实时交互等。未来计划将技术应用于智能照片管理工具,提供更高效的照片分类体验。欢迎对人脸检测技术感兴趣的读者一起探讨和进步。
393 7
|
9月前
|
人工智能 安全 Anolis
打造更 AI 的操作系统 《龙蜥+超级探访》第三期走进浪潮信息
且看龙蜥社区如何联合浪潮信息向更高层次的操作系统智能化迈进?
打造更 AI 的操作系统 《龙蜥+超级探访》第三期走进浪潮信息
|
开发框架 搜索推荐 数据中心
KDD2024最佳学生论文解读,中科大、华为诺亚:序列推荐新范式DR4SR
【9月更文挑战第25天】近年来,随着人工智能技术的发展,序列推荐系统(SR)因能捕捉用户动态偏好而在日常生活中愈发重要。然而,数据质量问题常被忽视。为解决此问题,中国科学技术大学与华为诺亚方舟实验室联合提出DR4SR,一种通过数据集再生提升序列推荐系统性能的新范式。DR4SR采用模型无关的数据再生方法,增强数据集的多样性和泛化能力,且可通过DR4SR+进行个性化调整以适应不同模型需求。实验表明,DR4SR和DR4SR+在多个数据集上显著提升了推荐系统性能。尽管面临计算资源和过拟合风险等挑战,该范式仍展现出巨大潜力。
364 7
|
机器学习/深度学习 SQL 存储
机器学习PAI常见问题之资源不足如何解决
PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。