数据地位提升迎来算法时代的风险投资

简介:  作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。

 作者Thomas Thurston是风投公司Ironstone Group的首席技术总监和资金经理。同时,他也是数据科学公司Growth Science的CEO,这家公司主要工作是运用算法和新的科技来预测商业行为。
 
数据在现代商业的决策中的地位在不断上升,那为何风投不跟上这个潮流呢? 什么时候风险投资的依据会从直觉转向算法呢?
 
我们生在一个算法的时代。便宜的计算和相应的软件给各个领域都带来了巨大的进步。现在的数据学家利用算法来预测天气,疾病,赛事结果,选举结果,哪部电影会最为卖座,甚至是你的未来另一半。
 
与此同时,风投业还处在十分古典的阶段,它更多的是一门艺术而非科学。因而,为何没有更多的VC利用数据科学来指导他们的投资呢?
 
传统的VC会去拜访那些初创企业,然后再用他们的个人直觉从中择优去劣。对少数精英VC来说,这种直觉引导的投资会带来极大的回报,然而全美的前500家风投却总体表现得并不如意。美国风投报告(National Venture Capital Index)显示,整个风投业在2000到2010年的整体回报率为负。我们无需为此指责VC们,毕竟从一群初创企业中选出其中的佼佼者比表面上看起来要难许多。然而为何不因此让VC们做出更多基于数据的决定呢?

       

对于将数据科学引入风投产业的阻力主要有两个:
 
首先,很多人会说基于数据科学的对初创企业的预测是十分不靠谱的,相较之下,他们更相信业内高手的直觉。
 
其次,即便假设基于数据科学的预测是靠谱的,依然有人认为这不可行。因为许多人认为这会引导不良的社会和道德风气(机器可以取代人的决定)。
 
尽管如此,数据科学早已进入了风投业。举例来说,有一家不愿透露姓名的风投完全采用数据分析的方式进行投资,并且已经掌握一亿六千五百万美元的基金,投资了大概四十家初创企业。这家企业利用近二十年来的风投数据,在两个星期内做出投资决定;并且,他们从不独立投资(只会和别的风投一起投资);而且从不在董事会占有席位。这家公司会根据初创企业的行为为其评分,然后把得分最高的公司进行人工审核然后才能通过最后的投资评审。
 
我所在的公司,Ironstone也使用类似的审核程序。Ironstone会使用机器和人工的混合评审法在两个星期内决定是否参投初创公司。如果在数据分析这关过不了,那这单投资就没戏。如果公式告诉我们,“这家公司能行”,那也需要经过第二层的人工审核阶段。Ironstone的数据采集自发给初创企业的调查问卷和来自其他途径的数据。不同的是,Ironstone是愿意独领一轮投资的。
 
Google Ventures作为一家投资了170多家初创企业的风投公司也使用这种混合审核法,在投资企业前对其进行严格的数据分析。Google Ventures的Bill Maris说:“我们有世界上最多的数据,也有最为强大的云计算能力。如果我们不利用这些资源而直接就去随意投资那实在是太愚蠢了。”据说现在很多更为传统的风投公司也开始使用一些数据分析了。
 
除了筛选优秀的初创企业和增加收益外,在风投中引入数据科学还有什么好处呢?
 

 
运用数据科学来筛选的好处之一就是它很快。一旦输入收集到的数据,很快确定的结果就可以出来了。这也就是像Ironstone这样的公司能在两个星期内就决定是否投资一家公司的原因了。相较之下,传统的VC可以很快的拒绝一家初创企业,但决定起是否投资一家初创企业来却非常的慢。如果一家初创企业被选中,VC们可以耗费数月的时间来争论是否投资这家公司。
 
  客观
 
传统的VC做出投资决定所凭借的大多是一时冲动,因而很容易受到一系列的认知误差的干扰。比如说,他们的决定可能会被当时的室温,之前吃的食物,睡眠质量还有其他杂七杂八的因素极大的影响。尽管算法可能看上去很笨,但它们总是客观的。它们不会感到疲惫、劳累、饥饿、情绪化或是被血统显赫的创办人误导。
 
 有理有据
 
创业者总是抱怨说VC总是用一些莫名其妙甚至是有问题的标准去评价他们的企业。确实,认知偏差可能会极大的干扰VC们,让他们没法集中精力去评析初创企业。相对的,数据科学可以完全的屏蔽这些认知“杂音”。尽管不同的算法带来的结果不同,但他们至少是基于现实的假设和数据的,而非一时的心血来潮。
 
有提高空间
 
算法背后的逻辑是直白而清晰的。你可以直接的看到它是怎样做出决定的。这使得算法有坚实的基础使它能够得到改进。然而直觉却不是这样的直白和清晰。VC们那些天马行空的直觉在长期可靠性上比起算法来实在是差远了。
 
然而在风投界,针对算法筛选的双重标准依然是存在的。对于一套算法来说,在考虑其是否能进入风投的决策程序时,VC还有投资者们几乎都会质询是否有支持它的大量数据,它在统计上的稳定性,以及在操作层面的可行性。不仅如此,他们还会苛求算法中出现的样本大小,紧密的对应关系,以及清晰的定义。然而VC们那些飘忽的直觉却往往既没有经过任何的统计测试,也没有在操作上确定过可行性,甚至一点都不简明清晰。
 
  延伸性
 
因为算法筛选的快速,客观,精准和可改进性,它能够极大的缩减每次决策所需要的时间和人力。这可以留出精力给VC们去增加他们的资金而不必陷入无尽的决策泥沼。
 
平均来说,一个活跃的VC一年大概会做四宗投资。这个数字不仅是因为VC有多少钱而确立,还受到保质保量的完成一宗投资所需要的人力和时间成本所限制。当资本开始扩张,传统风投极为耗费资源(人力和时间)的特点便显露无疑了。结果就是,拥有更多资本的VC想投需要资金量更大的公司,即便这本身没什么意义。 
VC们对于数据科学的抵触也许来源于他们与之相关的意愿和技能的缺失。有些VC直白的反对把数据科学引入风投,也有的在默默观察数据科学在风投中产生的效果,还有一些VC已经开始积极的运用数据科学进行风投了。只要没有偏见的人都看的出来,VC界正处在一个伟大时代开始前的黎明。


原文发布时间为:2013-11-15


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
4月前
|
存储 监控 算法
基于 C++ 哈希表算法实现局域网监控电脑屏幕的数据加速机制研究
企业网络安全与办公管理需求日益复杂的学术语境下,局域网监控电脑屏幕作为保障信息安全、规范员工操作的重要手段,已然成为网络安全领域的关键研究对象。其作用类似网络空间中的 “电子眼”,实时捕获每台电脑屏幕上的操作动态。然而,面对海量监控数据,实现高效数据存储与快速检索,已成为提升监控系统性能的核心挑战。本文聚焦于 C++ 语言中的哈希表算法,深入探究其如何成为局域网监控电脑屏幕数据处理的 “加速引擎”,并通过详尽的代码示例,展现其强大功能与应用价值。
98 2
|
5月前
|
数据采集 机器学习/深度学习 算法
别急着上算法,咱先把数据整明白:大数据分析的5个基本步骤,你都搞对了吗?
别急着上算法,咱先把数据整明白:大数据分析的5个基本步骤,你都搞对了吗?
205 4
|
2月前
|
存储 监控 算法
基于 Python 跳表算法的局域网网络监控软件动态数据索引优化策略研究
局域网网络监控软件需高效处理终端行为数据,跳表作为一种基于概率平衡的动态数据结构,具备高效的插入、删除与查询性能(平均时间复杂度为O(log n)),适用于高频数据写入和随机查询场景。本文深入解析跳表原理,探讨其在局域网监控中的适配性,并提供基于Python的完整实现方案,优化终端会话管理,提升系统响应性能。
67 4
|
3月前
|
机器学习/深度学习 算法
基于差分进化灰狼混合优化的SVM(DE-GWO-SVM)数据预测算法matlab仿真
本项目实现基于差分进化灰狼混合优化的SVM(DE-GWO-SVM)数据预测算法的MATLAB仿真,对比SVM和GWO-SVM性能。算法结合差分进化(DE)与灰狼优化(GWO),优化SVM参数以提升复杂高维数据预测能力。核心流程包括DE生成新种群、GWO更新位置,迭代直至满足终止条件,选出最优参数组合。适用于分类、回归等任务,显著提高模型效率与准确性,运行环境为MATLAB 2022A。
|
3月前
|
数据采集 算法 数据可视化
DROPP算法详解:专为时间序列和空间数据优化的PCA降维方案
DROPP(Dimensionality Reduction for Ordered Points via PCA)是一种专为有序数据设计的降维方法,通过结合协方差分析与高斯核函数调整,有效融入数据顺序特性。本文详细解析了DROPP的理论基础、实现步骤及其应用。算法核心在于利用相邻元素间的相似性特征,关注局部邻域信息以降低噪声影响,适用于时间序列或空间序列数据。文中通过模拟数据示例展示了算法的具体实现过程,并总结了其在气候研究和分子动力学等领域的广泛应用潜力。
124 0
DROPP算法详解:专为时间序列和空间数据优化的PCA降维方案
|
3月前
|
传感器 数据采集 人工智能
AI是如何收集体育数据的?从摄像头到算法,揭秘赛场背后的“数字间谍网“!
⚽ 你是否好奇:AI如何知道哈兰德每秒跑多快?教练的平板为何比裁判还清楚谁偷懒?本文揭秘AI收集体育数据的“黑科技”:视觉追踪、传感器网络、数据清洗与高阶分析。从高速摄像机捕捉梅西肌肉抖动,到GPS背心记录姆巴佩冲刺速度;从表情识别判断装伤,到量子计算模拟战术可能,AI正让体育更透明、精准。未来已来,2030年世界杯或将实现AI替代球探、裁判甚至教练!你认为AI数据收集算侵犯隐私吗?最想统计哪些奇葩指标?留言互动吧!
|
6月前
|
人工智能 编解码 算法
如何在Python下实现摄像头|屏幕|AI视觉算法数据的RTMP直播推送
本文详细讲解了在Python环境下使用大牛直播SDK实现RTMP推流的过程。从技术背景到代码实现,涵盖Python生态优势、AI视觉算法应用、RTMP稳定性及跨平台支持等内容。通过丰富功能如音频编码、视频编码、实时预览等,结合实际代码示例,为开发者提供完整指南。同时探讨C接口转换Python时的注意事项,包括数据类型映射、内存管理、回调函数等关键点。最终总结Python在RTMP推流与AI视觉算法结合中的重要性与前景,为行业应用带来便利与革新。
319 5
|
6月前
|
资源调度 算法 数据可视化
基于IEKF迭代扩展卡尔曼滤波算法的数据跟踪matlab仿真,对比EKF和UKF
本项目基于MATLAB2022A实现IEKF迭代扩展卡尔曼滤波算法的数据跟踪仿真,对比EKF和UKF的性能。通过仿真输出误差收敛曲线和误差协方差收敛曲线,展示三种滤波器的精度差异。核心程序包括数据处理、误差计算及可视化展示。IEKF通过多次迭代线性化过程,增强非线性处理能力;UKF避免线性化,使用sigma点直接处理非线性问题;EKF则通过一次线性化简化处理。
198 14
|
7月前
|
算法 图形学 数据安全/隐私保护
基于NURBS曲线的数据拟合算法matlab仿真
本程序基于NURBS曲线实现数据拟合,适用于计算机图形学、CAD/CAM等领域。通过控制顶点和权重,精确表示复杂形状,特别适合真实对象建模和数据点光滑拟合。程序在MATLAB2022A上运行,展示了T1至T7的测试结果,无水印输出。核心算法采用梯度下降等优化技术调整参数,最小化误差函数E,确保迭代收敛,提供高质量的拟合效果。
|
7月前
|
存储 监控 算法
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨
在数字化办公时代,公司监控上网软件成为企业管理网络资源和保障信息安全的关键工具。本文深入剖析C++中的链表数据结构及其在该软件中的应用。链表通过节点存储网络访问记录,具备高效插入、删除操作及节省内存的优势,助力企业实时追踪员工上网行为,提升运营效率并降低安全风险。示例代码展示了如何用C++实现链表记录上网行为,并模拟发送至服务器。链表为公司监控上网软件提供了灵活高效的数据管理方式,但实际开发还需考虑安全性、隐私保护等多方面因素。
104 0
公司监控上网软件架构:基于 C++ 链表算法的数据关联机制探讨

热门文章

最新文章