人生就像滚雪球,最重要之事是发现湿雪和长长的山坡-巴菲特
开源赛道是长坡,但也有厚雪
近年来,在资本市场,开源商业公司备受追捧,阿里巴巴以9千万欧元收购Flink母公司, Kafka母公司Confluent上市、市值114美金,DataBricks完成 10 亿美金H轮融资,国内PingCAP完成估值30亿美金的新一轮融资。可以说几乎每一周都有来自开源圈投融资的大新闻。
那么资本为何如此重视开源呢?们请到了知名投资机构的投资人来与大家共同畅聊开源企业的商业话题。
GGV 纪源资本投资副总裁 陈于思
线性资本执行董事 刘牧
阿里云数据库资深技术专家 黄贵
九合创投投资总监 王晓妍
Q1 江波(主持人):欢迎各位老师的到来,近两年在国内开源很热,其实也少不了资本的加持,所以请各位老师做以下自我介绍。
陈于思:大家好,我是来自GGV的陈于思。我们GGV是一个国际化的基金,大概十年前就在美国开始投资开源了,14年投资了HashiCorp的A轮投资,也是Hashicorp最大的投资人股东。相信很多开发者都用过Hashicorp的Terreform、Vault、Consul,HarshiCorp也支持阿里云的基础设施,它提供多云环境下的DevOps基础设施工具。Hashicorp公司上一轮融资估值达到了51亿美金,现在大概每年的年经常性收入ARR达到了几亿美金。在中国,我们投资了前面提到的PingCap,PingCap是NewSQL领域世界范围内的领先企业,是国内最成功的的开源软件公司。此外,我们还投过美国的Kong、Vercel等独角兽企业,欧洲的Jina,还有中国的涛思、EMQ、RT-thread等很多开源公司,我们是非常看好开源赛道的,也有着深入的积累和资源。
刘牧:大家好,我是刘牧,来自于线性资本,我们是一家聚焦于数据智能(Data Intelligence)以及前沿科技领域的专业投资机构,重点关注数据应用(Data Application)、数据基础设施(Data Infrastructure)和前沿科技应用领域的投资项目,在开源这块其实我们的投资历史还是非常悠久的。2014年,Facebook华人第一位Tech Lead王淮先生创立了线性资本,也注定把他的tech基因带入基金投资逻辑当中。所以在14年的时候,我们就投资了开源社区中很火的项目DCloud数字天堂,整个平台总共有900万的开发者用户,是目前开发者数量和案例最丰富的多端开发框架。核心就是解决了一个面对当下多模态的开发平台和开发环境,可以通过一套统一的开发框架,一套工程源代码编译和发布到所有的平台上去,大大的提高工程师开发效率。这是我们基金最早的与开源的结缘。
黄贵:大家好,我来自阿里云数据库,我本身是做技术研发,不是创投圈的。我跟阿里云战略投资部有一些接触,也参与过很多创业公司跟阿里云的合作。阿里云其实投资收购了Flink的母公司。之前在数据库领域其实跟很多数据库相关的公司也有合作,比如说像MariaDB,我们也有是独立的董事在那边,我们在阿里云上也有MangoDB的service,跟MangoDB也有战略合作。另外我们其实比较感兴趣的就是一些目前跟阿里云本身有一些业务上的合作,或者有互补性的业务、数据相关的平台、创业公司。像图数据库、文档数据库,包括数据开发的平台都有比较广泛的合作。
王晓妍:大家好,我是九合创投的王哓妍,我们基金是一个聚焦在科技早期的基金,因为我们基金的高管主要是来自于百度和阿里巴巴,所以从创始的那天起就有很深的工程师文化,所以我们对于infra和云原生领域是非常的关注,最早从14年、15年开始接触开源领域,并且在基础软件这块有很多布局,现在投资的portfolio包括datafuse是一个云原生数据仓库的公司,主要对标snowflake,还有EMQ是做开源的物联网消息中间件的公司,它有一个global市场,在海外有非常多的客户,还有跑象科技,主要做企业级流计算平台,AI领域我们也有布局,比如一流科技,聚焦机器学习开源框架。在硬件领域也有一些关注,投资了微核芯,基于RISC-V做CPU的公司。
Q2 江波(主持人):我们看到各位投资很多公司现在在整个市场上开始冒头,甚至开始成为独角兽了,其实都已经在市场上有非常高的知名度。我们都说近两年开源热,这是我们的主观感受,从投资公司的视角来说你们可能比市场更早的感觉到这个市场的崛起,可能在五年、十年前就已经有一些公司找到你们,我们也想听一听你们是从什么时候开始感受到国内开源开始热起来了,你们的感受是怎么样的,以及在这个过程中你们是怎么样去挑选比较好的投资标的的。
陈于思:GGV投开源从美国开始,10年间在中美布局了很多项目。我们之前做过一个内部回报分析,GGV开源方向的回报并不比互联网、移动互联网、消费领域差,甚至表现的更好。开源最开始,是一个非常好的程序员之间合作的方式,而有资本或者商业化公司在背后,可以帮助把这个事情发展的更好。比如说像DataBricks,如果不是这些伯克利的老师和学生们他们出来做了这家公司,现在我们还可以用Spark,Spark还会是非常流行的软件,但可能就不会有DeltaLake, 不会有MLOps等一系列的后续产品,包括整个DataBricks基于云的基础设施都不会出现。资本在背后还是起了非常大的作用。此外,像阿里云这样的公有云在过去几年时间发展的速度是远超我们的想象的,我们最近也把我们14年去投的HarshiCorp的Memo拿出来重新看了一下,发现当时还是极大的低估了这个公司发展方向和潜力,低估的就是云的发展,尤其是多云的发展。大家经常说:Cloud is eating the world。云可能是第四次生产力革命,很多的开源软件到最后商业模式都是基于云的,我来提供一个基于云的host service,或者我本身就是云基础设施的一部分。包括像刚才线性刘牧提到的做软硬一体化的平台,其实都是基于云,因为云的生产力工具诞生,所以会有很多新的机会出来。
回到当我们怎么看企业的时候,首先,我觉得是否全面的拥抱云原生,甚至说比现有的云技术想的更远,是一个很重要的维度。我们看HarshiCorp,现在看它是mutli-cloud的基础设施,但10年前觉得你能上公有云就不错了,怎么还有多云、混合云的需求。这就需要创业者本有vison、又是技术圈领袖者,能看到未来的技术到底需要怎样的一个基础设施。
第二,是否有构建社区的能力。在美国很多程序员非常能讲,能够吸引到很多人共同建设这个社区。在中国也有特别优秀的布道者,包括像台下的吴晟老师,是中国程序员界顶级的布道者。这样的一批人是公司必不可少的。
最后还会看重一点就是国际化的潜力,对于开源来说商业化的机会很多,至少这个阶段还是欧美为主的,欧美企业和欧美整体在云上面的开支和付费意愿要领先国内几年的时间。团队是否有国际化的基因或者意识,在打造产品的时候是否有国际化的规划,这也是我们比较看重的点。
黄贵:刚才主持人提到开源什么时候从中国这边热起来的。以我感觉的来看像国内几家比较热的开源公司成立也没有太长的时间。中国很多程序员他们是兴趣驱动的,也参与了很多大的开源软件和开源社区的建设,包括操作系统Linux、数据库等等,原来阿里巴巴很早就使用MySQL来替代传统的商业数据库软件,也大量参与了MySQL数据库社区的建设,包括早期还有Redis,现在也有core team member在里面。
到了今天这个阶段,最近五六年的时间,开源软件就不完全是一个个人兴趣驱动,变成了更多资本投进来,我觉得最近资本有一个比较有意思的现象,大家对基础软件或者基础平台,尤其是数据相关的平台有非常大的投资热情。其实这个事情我觉得投基础软件或者基础平台,是投资不那么友好的领域,因为投资一般来说比较大,回报周期长,风险高,因为基础软件常常涉及到比较大的生态,要建一个比较大的生态需要巨大的人力投入,如果不是非常大的资本投入是很难做起来的。但是开源恰恰提供了机会,开源里面有很多成功的案例,像Linux Hadoop Spark等等,都提供了非常有力的证据证明通过开源社区松散的组织同样可以构建非常复杂的基础系统和非常有深度的技术,这是对于资本来讲是有效的减少风险的模式。
再一个说开源软件如何做变现,早期的变现有几种途径:
一个是我有一个社区版和企业版,拿社区版给人免费使用,等到大家形成习惯以后让大家买企业版,企业版里有更多的高级地供企业使用功能。还有一种是我今天都开放,但是提供一些服务。
这两种模式,有一个很大的问题,它是很难规模化的,今天做服务需要特定的服务团队,那这个服务团队可能要做驻场、运维,对于很多大的企业来讲大概就有多少人就能做大规模的事情,是很难规模化的。但是云的出现彻底改变了这么一个情况,今天可以把基础软件作为一个服务的形式提供,所以各位创投老师都讲到,大家投的方向其实最终的变现变现路径都是服务化的模式。服务化今天不用每个地方布一个人或者团队,把所有的运维、基础设施建设、数据的备份、迁移的服务模式都放到云端做。对于企业来讲不用维护专门的服务团队,服务就可以规模化。对于云服务厂商来说规模化之后,成本下降了,利用云的基础设施,提供的服务本身可以做到实时的弹性,然后可以按照用户的需求去做资源配备,对于用户来讲他需要的资源不再说需要特定规格,而是用多少买多少。
我觉得未来,对开源软件尤其是开源基础软件来说,转向云服务应该是可以预见的最主流的变现方式。大家的投资逻辑也是往这个方向走,陈老师也讲到国际化,今天的云服务边界已经扩展了,不仅仅局限于某个地域的市场,天生就是国际化的,可以和很多大的国际云厂商合作。这个是我们今天为什么基础软件领域吸引了这么多资本的重要原因。
刘牧:刚刚两位嘉宾对于这快已经讲的非常多,也是我很有共鸣的点,比如说面向国际化的市场,程序员的共同语言都是通过Code完成的,他们面对的市场本质上是一样的,以及开源项目商业化最终打包成云服务这样的付费方式,其实是很容易商业化的形态,也是很被企业所接受的。
我这边补充一个点,我们在目前开源投资热浪中,比较坚守的点就是我们非常看重项目的原创性以及创始人背后系统思考能力,比如说最近看了一个方向,我们知道数据库的发展一开始是MySQL这样的经典的单机架构,然后往分布式架构走,就有scale out的需求。后面就延伸出了像Google Spanner等一系列产品,核心还是在数据库管理系统中事务所具有的ACID四种特性间做trade off。再往后这个架构会怎么走,如何在scale out的情况下仍然能做到更高的性能,且保障各个维度的特性如一致性等,以及面向差异化的多模态场景去提供分布式计算的能力。我们就要看创始人的系统思考能力,以及面临当下、未来的场景,会有怎样的演进。我们也看到现在出现了各种各样的数据库,比如说面向物联网场景的时序数据库、图数据库,包括更高性能的事务性数据库等,差异化多模态的场景需要一个统一化的平台。创始人有对过往的系统性思考,并且在新的场景下又能综合多模态的场景做成一个统一的产品化的东西,且有明确的实现路径。这样的创始人,是值得我们押注的。
晓妍:我们其实之前做过一个review,关于国际上对于开源领域的投资,曲线在17年、18年前后上涨非常明显,国内热度起来是滞后两年,差不多19年、20年。这里面我觉得云作为一个生产力工具普及了之后cloud hosting带来了一波很重要的机会,以前是on premise的模式,现在on cloud的模式是完全不一样的,对整个销售方式、客户服务方式以及整个团队的搭建、skill set都是完全不一样的。
开源非常有意思的一点是它是2B的生意,而且又拥有2C病毒式传播的特性,是让投资人觉得非常值得分析的点。我们总结了一下开源的规律,大多独角兽的成长周期,从开源到做商业化大约是四到五年,从商业化到独角兽大概用3-5年的时间,后面商业化之后增长指数级的曲线是非常惊人的,这是真正引发投资人对这个领域关注的原因。
我相信阿里云的同学有很多印象,刚开始我们在卖云的时候,其实说我们卖云资源,存储资源、计算资源指向的是硬件价值,卖的时候会说我卖你一个云资源,同时送你一套大数据平台,以前软件的价值没有得到认可。但是近几年看到欧美开源软件独角兽的崛起,他们的市值达到了百亿美金、千亿美金的规模,让我们看到软件的价值得到认可,而且是基础软件。基础软件和应用型SAAS有很多不同,应用型SAAS肯定是特定的需求,而且是容易理解的场景,比如说CRM、ERP,但是基础设施比如说DataBase、大数据平台、中间件,其实大家并不那么容易理解,所以基础软件整个链条会更长一点。它会起始于社区,一些极客、程序员、码农们对它的热爱,但是需要终于对企业级客户的销售、采购的决策以及最终的客户成功,真正的给企业带来价值,在这个链条中开源贡献了很多战略价值以及带来了真正的经济价值。这是我们非常看好它(开源)的原因。
Q3:江波(主持人):刚刚在聊的过程中也有老师提到,单单说基础软件并不是一个非常好的投资标的,因为周期比较长,不确定性大,所以最后一个问题聊一聊为什么在有相对比较大的风险情况下,大家还是愿意投入这么多来押注开源赛道?
刘牧:我们本身是一家头部的美元加人民币的双币基金,美元基金背后都是一些非常长期主义驱动的资本,比如像Stanford endowment fund。所以整个周期也会非常长,我们有能力、有实力、有意愿去直支持这样一个需要长周期发展,并且有潜力产生巨大回报的方向的创业公司。这是第一点。
第二点,就像我们上一个圆桌讲到的云化、标准化是在这个行业当中正在发生的巨大变化。我自己本身是工业界出身,工业界的大规模生产来源于它的精细化的分工协作,来源于上下游供应链的标准化和解耦。标准化带来的需求是单体的“零部件”做到极致,那么他业务的Scale up能力就会非常高,有能力形成大规模的业务增长,所以在这点上这个方向符合VC所投资的潜在标的是指数性增长的需求。
黄贵:投infra这个领域风险虽然很大,开源软件研发模式我觉得有效的降低了风险,我因为技术栈非常深的领域,但是实际上我们不是说今天是从头开始,因为很多开源系统做了大量基础性工作,就拿pingCAP来说底下存储系统用的是RustDB。今天并不完全需要从头开始,今天有很多开源组件是可利用的。
再一个,开源是有效的触达客户的途径,如果一开始就抛出来一个大的平台,找到客户去用,客户很难信任。但是今天作为一个开源软件,本身我的代码是公开的,对用户来说他会了解你的软件,他知道你在干什么,会自然的感兴趣。大家可以看到所有的开源软件从一开始是比较简陋的,只需要一两个核心的比较有趣的想法,或者是一个创新点,然后它会有很多用户感兴趣用,用了之后会提有效的建议,一旦开源社区以非常正向的反馈运作起来以后,发展是非常快的。大家看到现在很多尤其是数据相关的软件,在整个发展过程中的路径被大大缩短了,以前传统的商业软件闭环的流程是非常长的,从用户反馈到改进系统设计再出新的版本,但开源软件迭代的速度远远的快于传统的商业软件。
infra领域整个数据链条是很长的,以数据处理为例,我们做在线交易,数据落到数据库里面,把它同步到数据仓库里面,然后还有大数据平台,后面还有BI的分析、AI的系统都会构建在这个平台上。有很多做数据汇集、收取、转化、可视化的,每个环节都有很多机会可以做,所以现在很多的infra公司并不见得做一个大而全的统一系统,做的是很多细分的领域,那这些细分的领域如果做的足够专业,足够有创新力,一样可以占据非常好的领域市场。
王晓妍:刚才也分享到开源软件成长的生命周期,所以我们也认为它的曲线刚开始是平的,一旦过了某个拐点之后,上涨的非常快。所以我们觉得从投资的价值来看,真的就是符合时间的玫瑰,而且从整个市场风向的变化来说,我们发现企业级客户对于基础软件的认知和付费能力,是在改变的,可能过了一定拐点之后,整个市场的推动力是完全不一样的,一旦一个行业当中有一家头部客户的业务跑在了数据驱动的内核上,它的整个业务对客户的反应周期、带来的客户体验是完全不一样的。一旦他完全的领先于其他的第二梯队、第三梯队的竞争对手,其他的player都非常想去跟进。
陈于思:在美国,我们GGV其实把这个钱赚过一遍了,在中国我们也希望同样找到同样高潜的公司。开源公司发展的过程还是比较长的,可能做一个项目需要几年,做完项目需要变现,可能又是几年时间。而很多时候做项目的时候需要的能力,和做变现的能力是不一样的,所以整个创始团队的成长能力,以及持续迭代升级能力都需要。以我们GGV的经验和全球的资源,在适当的时候也可以帮助公司一把,结合中国云化的趋势,结合全球化对新的软件、基础设施需求,再结合中国非常多的顶级创业者,他们都已经开始投身到这个赛道了,综合以上原因,即使这个赛道可能是长坡,但还是有非常大的机会的,我们非常看好开源这个赛道,是长坡,也有厚雪。
本文整理自2021云栖大会开源引力峰会《风口下的开源,为什么资本这么重视开源赛道》圆桌。