数据地位提升迎来算法时代的风险投资

简介:  作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。

 作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。
 
数据在现代商业的决策中的地位在不断上升,那为何风投不跟上这个潮流呢? 什么时候风险投资的依据会从直觉转向算法呢?
 
我们生在一个算法的时代。便宜的计算和相应的软件给各个领域都带来了巨大的进步。现在的数据学家利用算法来预测天气,疾病,赛事结果,选举结果,哪部电影会最为卖座,甚至是你的未来另一半。
 
与此同时,风投业还处在十分古典的阶段,它更多的是一门艺术而非科学。因而,为何没有更多的VC利用数据科学来指导他们的投资呢?
 
传统的VC会去拜访那些初创企业,然后再用他们的个人直觉从中择优去劣。对少数精英VC来说,这种直觉引导的投资会带来极大的回报,然而全美的前500家风投却总体表现得并不如意。美国风投报告(National Venture Capital Index)显示,整个风投业在2000到2010年的整体回报率为负。我们无需为此指责VC们,毕竟从一群初创企业中选出其中的佼佼者比表面上看起来要难许多。然而为何不因此让VC们做出更多基于数据的决定呢?

       

对于将数据科学引入风投产业的阻力主要有两个:
 
首先,很多人会说基于数据科学的对初创企业的预测是十分不靠谱的,相较之下,他们更相信业内高手的直觉。
 
其次,即便假设基于数据科学的预测是靠谱的,依然有人认为这不可行。因为许多人认为这会引导不良的社会和道德风气(机器可以取代人的决定)。
 
尽管如此,数据科学早已进入了风投业。举例来说,有一家不愿透露姓名的风投完全采用数据分析的方式进行投资,并且已经掌握一亿六千五百万美元的基金,投资了大概四十家初创企业。这家企业利用近二十年来的风投数据,在两个星期内做出投资决定;并且,他们从不独立投资(只会和别的风投一起投资);而且从不在董事会占有席位。这家公司会根据初创企业的行为为其评分,然后把得分最高的公司进行人工审核然后才能通过最后的投资评审。
 
我所在的公司,Ironstone也使用类似的审核程序。Ironstone会使用机器和人工的混合评审法在两个星期内决定是否参投初创公司。如果在数据分析这关过不了,那这单投资就没戏。如果公式告诉我们,“这家公司能行”,那也需要经过第二层的人工审核阶段。Ironstone的数据采集自发给初创企业的调查问卷和来自其他途径的数据。不同的是,Ironstone是愿意独领一轮投资的。
 
Google Ventures作为一家投资了170多家初创企业的风投公司也使用这种混合审核法,在投资企业前对其进行严格的数据分析。Google Ventures的Bill Maris说:“我们有世界上最多的数据,也有最为强大的云计算能力。如果我们不利用这些资源而直接就去随意投资那实在是太愚蠢了。”据说现在很多更为传统的风投公司也开始使用一些数据分析了。
 
除了筛选优秀的初创企业和增加收益外,在风投中引入数据科学还有什么好处呢?
 

 
运用数据科学来筛选的好处之一就是它很快。一旦输入收集到的数据,很快确定的结果就可以出来了。这也就是像Ironstone这样的公司能在两个星期内就决定是否投资一家公司的原因了。相较之下,传统的VC可以很快的拒绝一家初创企业,但决定起是否投资一家初创企业来却非常的慢。如果一家初创企业被选中,VC们可以耗费数月的时间来争论是否投资这家公司。
 
  客观
 
传统的VC做出投资决定所凭借的大多是一时冲动,因而很容易受到一系列的认知误差的干扰。比如说,他们的决定可能会被当时的室温,之前吃的食物,睡眠质量还有其他杂七杂八的因素极大的影响。尽管算法可能看上去很笨,但它们总是客观的。它们不会感到疲惫、劳累、饥饿、情绪化或是被血统显赫的创办人误导。
 
 有理有据
 
创业者总是抱怨说VC总是用一些莫名其妙甚至是有问题的标准去评价他们的企业。确实,认知偏差可能会极大的干扰VC们,让他们没法集中精力去评析初创企业。相对的,数据科学可以完全的屏蔽这些认知“杂音”。尽管不同的算法带来的结果不同,但他们至少是基于现实的假设和数据的,而非一时的心血来潮。
 
有提高空间
 
算法背后的逻辑是直白而清晰的。你可以直接的看到它是怎样做出决定的。这使得算法有坚实的基础使它能够得到改进。然而直觉却不是这样的直白和清晰。VC们那些天马行空的直觉在长期可靠性上比起算法来实在是差远了。
 
然而在风投界,针对算法筛选的双重标准依然是存在的。对于一套算法来说,在考虑其是否能进入风投的决策程序时,VC还有投资者们几乎都会质询是否有支持它的大量数据,它在统计上的稳定性,以及在操作层面的可行性。不仅如此,他们还会苛求算法中出现的样本大小,紧密的对应关系,以及清晰的定义。然而VC们那些飘忽的直觉却往往既没有经过任何的统计测试,也没有在操作上确定过可行性,甚至一点都不简明清晰。
 
  延伸性
 
因为算法筛选的快速,客观,精准和可改进性,它能够极大的缩减每次决策所需要的时间和人力。这可以留出精力给VC们去增加他们的资金而不必陷入无尽的决策泥沼。
 
平均来说,一个活跃的VC一年大概会做四宗投资。这个数字不仅是因为VC有多少钱而确立,还受到保质保量的完成一宗投资所需要的人力和时间成本所限制。当资本开始扩张,传统风投极为耗费资源(人力和时间)的特点便显露无疑了。结果就是,拥有更多资本的VC想投需要资金量更大的公司,即便这本身没什么意义。 
VC们对于数据科学的抵触也许来源于他们与之相关的意愿和技能的缺失。有些VC直白的反对把数据科学引入风投,也有的在默默观察数据科学在风投中产生的效果,还有一些VC已经开始积极的运用数据科学进行风投了。只要没有偏见的人都看的出来,VC界正处在一个伟大时代开始前的黎明。


原文发布时间为:2013-11-15


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
30天前
|
机器学习/深度学习 算法 前端开发
别再用均值填充了!MICE算法教你正确处理缺失数据
MICE是一种基于迭代链式方程的缺失值插补方法,通过构建后验分布并生成多个完整数据集,有效量化不确定性。相比简单填补,MICE利用变量间复杂关系,提升插补准确性,适用于多变量关联、缺失率高的场景。本文结合PMM与线性回归,详解其机制并对比效果,验证其在统计推断中的优势。
641 11
别再用均值填充了!MICE算法教你正确处理缺失数据
|
2月前
|
传感器 机器学习/深度学习 算法
【使用 DSP 滤波器加速速度和位移】使用信号处理算法过滤加速度数据并将其转换为速度和位移研究(Matlab代码实现)
【使用 DSP 滤波器加速速度和位移】使用信号处理算法过滤加速度数据并将其转换为速度和位移研究(Matlab代码实现)
185 1
|
3月前
|
机器学习/深度学习 Dragonfly 人工智能
基于蜻蜓算法优化支持向量机(DA-SVM)的数据多特征分类预测研究(Matlab代码实现)
基于蜻蜓算法优化支持向量机(DA-SVM)的数据多特征分类预测研究(Matlab代码实现)
|
2月前
|
机器学习/深度学习 算法 调度
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
291 0
|
23天前
|
机器学习/深度学习 人工智能 算法
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
|
2月前
|
存储 监控 算法
企业电脑监控系统中基于 Go 语言的跳表结构设备数据索引算法研究
本文介绍基于Go语言的跳表算法在企业电脑监控系统中的应用,通过多层索引结构将数据查询、插入、删除操作优化至O(log n),显著提升海量设备数据管理效率,解决传统链表查询延迟问题,实现高效设备状态定位与异常筛选。
102 3
|
2月前
|
算法 数据挖掘 定位技术
基于密度的聚类算法能够在含有噪声的数据集中识别出任意形状和大小的簇(Matlab代码实现)
基于密度的聚类算法能够在含有噪声的数据集中识别出任意形状和大小的簇(Matlab代码实现)
|
2月前
|
机器学习/深度学习 数据采集 运维
改进的遗传算法优化的BP神经网络用于电厂数据的异常检测和故障诊断
改进的遗传算法优化的BP神经网络用于电厂数据的异常检测和故障诊断
|
3月前
|
机器学习/深度学习 传感器 边缘计算
【轴承故障诊断】基于融合鱼鹰和柯西变异的麻雀优化算法OCSSA-VMD-CNN-BILSTM轴承诊断研究【西储大学数据】(Matlab代码实现)
【轴承故障诊断】基于融合鱼鹰和柯西变异的麻雀优化算法OCSSA-VMD-CNN-BILSTM轴承诊断研究【西储大学数据】(Matlab代码实现)
107 0
|
3月前
|
算法 数据可视化 数据挖掘
基于AOA算术优化的KNN数据聚类算法matlab仿真
本程序基于AOA算术优化算法优化KNN聚类,使用Matlab 2022A编写。通过AOA搜索最优特征子集,提升KNN聚类精度,并对比不同特征数量下的聚类效果。包含完整仿真流程与可视化结果展示。

热门文章

最新文章