开源数字基础设施
开源软件是基础设施发展的一种模式,这是在2007年美国科学基金会发布的《认识基础设施:动力机制、冲突和设计》中得出的结论。在这份55页的报告中三次集中谈到了开源软件(Open Source),可见开源软件对于参与现代基础设施研讨会的专家来说是多么重要。在报告中,开源软件基础设施是作为挑战传统基础设施模式的代表,它代表了激活美国新型技术发展的新模式。
在报告中,第一次提到开源软件是把它作为改变传统“大型技术系统”来说的,大型技术系统大都采用大型企业集中建设的模式。作者们指出,1975年在美国和英国等地开始出现大型基础设施逐渐解除管制,趋于市场化运行,例如航空市场、电话、电视和能源行业等。
报告撰写者给予了开源软件非常高的地位,他们认为,正是诸如Mozilla Firefox和Linux等开源软件模式的成功,才使之成为政府资助大型项目的另一种理想主义模式。报告引用了学者拉塞尔(Russell)在2006年对互联网的研究成果,认为互联网是开源软件的前奏。
开源软件在第二次被提及的时候,作者们表示,“美国国家科学基金会网络基础设施的报告反映出对单一供应商提供大型和长期项目的厌恶,而表现出对开源软件模式的热情。”
为了证明这个结论,报告撰写者提出了虚拟基础设施的概念。他们指出,电子邮件、万维网和移动电话等是分布式网络,通过这种方式,可以提供更好的信息技术服务。利用协同机制,可以大大扩充分布式网络基础设施的服务能力,这种模式预示着未来基础设施的建设方向。
在分析基础设施的拥有权和投资模式时,开源软件再次被提及。由于基础设施会涉及政府投资,较大规模的人群将从中获益,因此,基础设施的建设不得不面临投资和收益的责问。在西方国家,大规模的基础设施决策流程比较长,其主要工作包含获得公众的许可,所以能够解决这个矛盾的分布式开发方式备受推崇,开源软件再次被作为典型模式提及。
美国国家科学基金会几位专家撰写的这份报告,成为最早的关于开源软件与基础设施间关系的系统论述。简言之,在这些专家眼中,开源软件就是一种新型基础设施。从后续一些专家所做的研究来看,他们也基本认同了这种观点。笔者从2015年开始思考和研究这个主题,结合新一代数字技术,初步形成了“开源数字基础设施”(ODI,Open Digital Infrastructure)的认识。
对于开源数字基础设施的完整认知,还是应该从开源软件的发展史开始。众所周知,开源软件自1998年提出之后,经历了多年的发展,2008年发布的《开源软件2.0:正在进行的演进》(Open Sources 2.0: The Continuing Evolution)预示着美国肇始的开源软件革命已经进入一个新阶段,它是1999年《开源软件:开源软件革命的声音》(Open Sources: Voices from the Open Source Revolution)的延续。
经过20年时间的发展,开源软件不但成了一个成熟的产业,包含各种具有成熟商业模式的开源产品和解决方案,还有专门托管开源代码的平台,美国拥有全球最完整的开源基金会等开源软件产业链成员。2018年微软花费75亿美元收购开源代码托管平台GitHub和IBM斥资334亿美元收购Linux厂商红帽(Redhat),成为以上结论的最好佐证。
如果一个产业尚未达到成熟阶段,美国成熟的上市公司难以花费几十亿乃至几百亿美元收购其中的企业,因此,开源软件已经成为成熟的产业。更为可怕的是,这个产业几乎都由美国企业掌控,其他国家几乎没有多少话语权,虽然零星有一些国家启动开源项目,但最终都要由美国开源基金会孵化,同时还要由美国开源代码托管平台承载。
全球呈现出这样的数字技术格局,完全是由于除美国之外的国家对数字技术的认识不足造成的。从开源软件的理论研究来看,美国拥有大量的“奇谈怪论”,特别是在开源社区成立之初,就是为了挑战大企业的垄断地位,而美国社会通常也认为大企业是垄断之源,将给创新带来障碍,更别说要搞颠覆性创新了,这根本不是大企业可以完成的任务。这样的认识难以在其他国家生根发芽,更别说成为行业发展的主流思想了。
中国目前正在推进新型基础设施建设,如果不认真对待开源数字基础设施的问题,就不可能在第四次工业革命中获得领导地位。如果我们围绕新型基础设施中的信息基础设施、融合基础设施和创新基础设施进行仔细分析,会惊讶地发现,80%以上的基础设施都依赖开源软件,特别是信息基础设施和创新基础设施,它们自始至终都依赖开源软件,如图
信息基础设施普遍受惠于开源项目。通信网络基础设施中,5G有多个开源项目,例如,美国贝尔实验室和法国电信分别牵头启动了开源5G项目,其目的就是为了挑战爱立信等公司的垄断地位。新技术基础设施拥有五花八门的开源项目,全球大量企业都是基于这些开源项目进行二次开发实现的,以求快速获得风险投资的青睐。对于算力基础设施来说,除了少数大型互联网公司自主研发主要软件,其他公司都从开源社区获得了大部分开源软件,以便建设数据中心和智能计算基础设施。
融合基础设施与互联网、大数据和人工智能等技术有紧密的关系,自然难以逃脱应用大量的开源软件,由于这些软件涉及开发者建立生态或获得数据交换的目的,大部分都是通过开源软件的方式分发的。当然,这些软件往往也提供收费的服务,以便帮助使用者更快、更好地完成相关项目的开发。
由于创新基础设施包含科教基础设施,这就涉及开放科学(Open Science)这个领域,除了科技方面的论文需要研究者提供源代码,以便验证是否有作假,增加自己论文观点的可信度外,对于全球性科研分享的通常规则,提供开源软件几乎是证明自己研究成果的唯一方式。对于一些不能提供开源代码的科研项目,其他学者大都嗤之以鼻,认为不值得去关注,这对于学者来说则是致命的问题。
我们认为开源数字基础设施是一种基础设施,它可以为信息基础设施、融合基础设施和创新基础设施所用,事实上,开源数字基础设施是其他基础设施的基础设施,这种说法怎么强调都不为过。从美国的实践来看,政府在推进数字基础设施的时候,通常要求供应商尽量提供开源项目,例如,DARPA专门设立了开源软件办公室,为公众提供数据相关的开源软件,在美国政府推动的开放数据项目中,也要求相关软件以开源方式提供。
不过,开源软件的推动的确很难,这已经在过去20年的探索和尝试中得到了证明。2003年,德国慕尼黑市议会投票决定启用Linux集成版本LiMux项目,将所有的政府个人电脑和软件系统从Windows迁移到开源软件应用。到2013年,该市政府中80%的台式机都运行LiMux软件。在尝试运行开源软件长达15年之后,慕尼黑决定重新使用Windows系统。当然,中国在2005年左右也推行过开源软件,最终却无疾而终。
开源软件是一种分布式的产业形态,本身是想利用大众参与的方式来建设,如果变成了政府支持的项目,那么难免会出现寻租活动,导致不少参与者为了获得资金支持而参与项目。最近20年关于开源软件经济学的研究成果有很多,已经形成了较为成熟的成果,包括开源生态的组织、激励和管理等理论,特别是大量开源软件企业发挥了颠覆性创新的效用,从市场竞争中找到了商业模式。