数据地位提升迎来算法时代的风险投资

简介:  作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。

 作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。
 
数据在现代商业的决策中的地位在不断上升,那为何风投不跟上这个潮流呢? 什么时候风险投资的依据会从直觉转向算法呢?
 
我们生在一个算法的时代。便宜的计算和相应的软件给各个领域都带来了巨大的进步。现在的数据学家利用算法来预测天气,疾病,赛事结果,选举结果,哪部电影会最为卖座,甚至是你的未来另一半。
 
与此同时,风投业还处在十分古典的阶段,它更多的是一门艺术而非科学。因而,为何没有更多的VC利用数据科学来指导他们的投资呢?
 
传统的VC会去拜访那些初创企业,然后再用他们的个人直觉从中择优去劣。对少数精英VC来说,这种直觉引导的投资会带来极大的回报,然而全美的前500家风投却总体表现得并不如意。美国风投报告(National Venture Capital Index)显示,整个风投业在2000到2010年的整体回报率为负。我们无需为此指责VC们,毕竟从一群初创企业中选出其中的佼佼者比表面上看起来要难许多。然而为何不因此让VC们做出更多基于数据的决定呢?

       

对于将数据科学引入风投产业的阻力主要有两个:
 
首先,很多人会说基于数据科学的对初创企业的预测是十分不靠谱的,相较之下,他们更相信业内高手的直觉。
 
其次,即便假设基于数据科学的预测是靠谱的,依然有人认为这不可行。因为许多人认为这会引导不良的社会和道德风气(机器可以取代人的决定)。
 
尽管如此,数据科学早已进入了风投业。举例来说,有一家不愿透露姓名的风投完全采用数据分析的方式进行投资,并且已经掌握一亿六千五百万美元的基金,投资了大概四十家初创企业。这家企业利用近二十年来的风投数据,在两个星期内做出投资决定;并且,他们从不独立投资(只会和别的风投一起投资);而且从不在董事会占有席位。这家公司会根据初创企业的行为为其评分,然后把得分最高的公司进行人工审核然后才能通过最后的投资评审。
 
我所在的公司,Ironstone也使用类似的审核程序。Ironstone会使用机器和人工的混合评审法在两个星期内决定是否参投初创公司。如果在数据分析这关过不了,那这单投资就没戏。如果公式告诉我们,“这家公司能行”,那也需要经过第二层的人工审核阶段。Ironstone的数据采集自发给初创企业的调查问卷和来自其他途径的数据。不同的是,Ironstone是愿意独领一轮投资的。
 
Google Ventures作为一家投资了170多家初创企业的风投公司也使用这种混合审核法,在投资企业前对其进行严格的数据分析。Google Ventures的Bill Maris说:“我们有世界上最多的数据,也有最为强大的云计算能力。如果我们不利用这些资源而直接就去随意投资那实在是太愚蠢了。”据说现在很多更为传统的风投公司也开始使用一些数据分析了。
 
除了筛选优秀的初创企业和增加收益外,在风投中引入数据科学还有什么好处呢?
 

 
运用数据科学来筛选的好处之一就是它很快。一旦输入收集到的数据,很快确定的结果就可以出来了。这也就是像Ironstone这样的公司能在两个星期内就决定是否投资一家公司的原因了。相较之下,传统的VC可以很快的拒绝一家初创企业,但决定起是否投资一家初创企业来却非常的慢。如果一家初创企业被选中,VC们可以耗费数月的时间来争论是否投资这家公司。
 
  客观
 
传统的VC做出投资决定所凭借的大多是一时冲动,因而很容易受到一系列的认知误差的干扰。比如说,他们的决定可能会被当时的室温,之前吃的食物,睡眠质量还有其他杂七杂八的因素极大的影响。尽管算法可能看上去很笨,但它们总是客观的。它们不会感到疲惫、劳累、饥饿、情绪化或是被血统显赫的创办人误导。
 
 有理有据
 
创业者总是抱怨说VC总是用一些莫名其妙甚至是有问题的标准去评价他们的企业。确实,认知偏差可能会极大的干扰VC们,让他们没法集中精力去评析初创企业。相对的,数据科学可以完全的屏蔽这些认知“杂音”。尽管不同的算法带来的结果不同,但他们至少是基于现实的假设和数据的,而非一时的心血来潮。
 
有提高空间
 
算法背后的逻辑是直白而清晰的。你可以直接的看到它是怎样做出决定的。这使得算法有坚实的基础使它能够得到改进。然而直觉却不是这样的直白和清晰。VC们那些天马行空的直觉在长期可靠性上比起算法来实在是差远了。
 
然而在风投界,针对算法筛选的双重标准依然是存在的。对于一套算法来说,在考虑其是否能进入风投的决策程序时,VC还有投资者们几乎都会质询是否有支持它的大量数据,它在统计上的稳定性,以及在操作层面的可行性。不仅如此,他们还会苛求算法中出现的样本大小,紧密的对应关系,以及清晰的定义。然而VC们那些飘忽的直觉却往往既没有经过任何的统计测试,也没有在操作上确定过可行性,甚至一点都不简明清晰。
 
  延伸性
 
因为算法筛选的快速,客观,精准和可改进性,它能够极大的缩减每次决策所需要的时间和人力。这可以留出精力给VC们去增加他们的资金而不必陷入无尽的决策泥沼。
 
平均来说,一个活跃的VC一年大概会做四宗投资。这个数字不仅是因为VC有多少钱而确立,还受到保质保量的完成一宗投资所需要的人力和时间成本所限制。当资本开始扩张,传统风投极为耗费资源(人力和时间)的特点便显露无疑了。结果就是,拥有更多资本的VC想投需要资金量更大的公司,即便这本身没什么意义。 
VC们对于数据科学的抵触也许来源于他们与之相关的意愿和技能的缺失。有些VC直白的反对把数据科学引入风投,也有的在默默观察数据科学在风投中产生的效果,还有一些VC已经开始积极的运用数据科学进行风投了。只要没有偏见的人都看的出来,VC界正处在一个伟大时代开始前的黎明。


原文发布时间为:2013-11-15


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
2月前
|
存储 编解码 负载均衡
数据分片算法
【10月更文挑战第25天】不同的数据分片算法适用于不同的应用场景和数据特点,在实际应用中,需要根据具体的业务需求、数据分布情况、系统性能要求等因素综合考虑,选择合适的数据分片算法,以实现数据的高效存储、查询和处理。
|
2月前
|
存储 缓存 算法
分布式缓存有哪些常用的数据分片算法?
【10月更文挑战第25天】在实际应用中,需要根据具体的业务需求、数据特征以及系统的可扩展性要求等因素综合考虑,选择合适的数据分片算法,以实现分布式缓存的高效运行和数据的合理分布。
|
3月前
|
机器学习/深度学习 人工智能 算法
"拥抱AI规模化浪潮:从数据到算法,解锁未来无限可能,你准备好迎接这场技术革命了吗?"
【10月更文挑战第14天】本文探讨了AI规模化的重要性和挑战,涵盖数据、算法、算力和应用场景等方面。通过使用Python和TensorFlow的示例代码,展示了如何训练并应用一个基本的AI模型进行图像分类,强调了AI规模化在各行业的广泛应用前景。
49 5
|
2月前
|
存储 JSON 算法
TDengine 检测数据最佳压缩算法工具,助你一键找出最优压缩方案
在使用 TDengine 存储时序数据时,压缩数据以节省磁盘空间是至关重要的。TDengine 支持用户根据自身数据特性灵活指定压缩算法,从而实现更高效的存储。然而,如何选择最合适的压缩算法,才能最大限度地降低存储开销?为了解决这一问题,我们特别推出了一个实用工具,帮助用户快速判断并选择最适合其数据特征的压缩算法。
69 0
|
3月前
|
人工智能 算法 前端开发
无界批发零售定义及无界AI算法,打破传统壁垒,累积数据流量
“无界批发与零售”是一种结合了批发与零售的商业模式,通过后端逻辑、数据库设计和前端用户界面实现。该模式支持用户注册、登录、商品管理、订单处理、批发与零售功能,并根据用户行为计算信用等级,确保交易安全与高效。
|
3月前
|
前端开发 算法 JavaScript
无界SaaS模式深度解析:算力算法、链接力、数据确权制度
私域电商的无界SaaS模式涉及后端开发、前端开发、数据库设计、API接口、区块链技术、支付和身份验证系统等多个技术领域。本文通过简化框架和示例代码,指导如何将核心功能转化为技术实现,涵盖用户管理、企业店铺管理、数据流量管理等关键环节。
|
3月前
|
机器学习/深度学习 算法 数据处理
EM算法对人脸数据降维(机器学习作业06)
本文介绍了使用EM算法对人脸数据进行降维的机器学习作业。首先通过加载ORL人脸数据库,然后分别应用SVD_PCA、MLE_PCA及EM_PCA三种方法实现数据降维,并输出降维后的数据形状。此作业展示了不同PCA变种在人脸数据处理中的应用效果。
50 0
|
4月前
|
存储 算法 测试技术
预见未来?Python线性回归算法:数据中的秘密预言家
【9月更文挑战第11天】在数据的海洋中,线性回归算法犹如智慧的预言家,助我们揭示未知。本案例通过收集房屋面积、距市中心距离等数据,利用Python的pandas和scikit-learn库构建房价预测模型。经过训练与测试,模型展现出较好的预测能力,均方根误差(RMSE)低,帮助房地产投资者做出更明智决策。尽管现实关系复杂多变,线性回归仍提供了有效工具,引领我们在数据世界中自信前行。
61 5
|
3月前
|
存储 算法 搜索推荐
算法进阶之路:Python 归并排序深度剖析,让数据排序变得艺术起来!
算法进阶之路:Python 归并排序深度剖析,让数据排序变得艺术起来!
88 0