美国VC使用什么数据分析工具?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:        长期以来,创业投资的方法被当做一门艺术在一个相对小的圈子内流传。富有经验的 VC 往往喜欢将自己的成功归因于这门艺术的历久弥新,而识人术又是这门艺术的重中之重。一个初创公司的团队 (team),还是产品 (product),抑或是市场 / 产品吸引力 (traction),都会被作为重要指标而影响每一个 VC 的投资决策。
+关注继续查看
0.jpg

       长期以来,创业投资的方法被当做一门艺术在一个相对小的圈子内流传。富有经验的 VC 往往喜欢将自己的成功归因于这门艺术的历久弥新,而识人术又是这门艺术的重中之重。一个初创公司的团队 (team),还是产品 (product),抑或是市场 / 产品吸引力 (traction),都会被作为重要指标而影响每一个 VC 的投资决策。

  对于一个初创公司而言 (尤其是尚处早期的团队 early-stage startup),除了有可能实际存在的产品外 (算上半成品及开发原型),剩下的指标都可以说是虚无缥缈。人们早已习惯了如此的筛选机制:投资人在乎的是感觉,看顺眼或许比产品概念更为受用。至于这套机制是否成功,则需另当别论:美国风投协会(National Venture Capital Association) 的一组数据显示,在 21 世纪的第一个十年内,美国创投业的总体回报率为负数。在这个大数据概念横行的时代,像创投业这样长期位于科技行业风口浪尖并且耳濡目染各种新科技的行业,要把数据分析结合进传统做法中的尝试也已是老调新弹。

  数据分析被广泛地应用于各行各业,尤其在金融业中。资产管理公司 (asset management) 和基金公司们早在数十年前便已大规模地应用数学理论来衡量公司投资产品的质量以及预测未来的市场表现。而与之一墙之隔、同属金融行业的 VC 公司们,使用数据分析来量化评估投资看起来也应该是一件理所应当的事。

  我们之前也数次讨论过数据分析对风投领域可能产生的影响和价值。以 Google Ventures 为代表,包括我们耳熟能详的 KPCB 和红杉资本 (Sequoia Capital) 在内的一众创投对数据分析投资的兴趣已经持续了好几年,而像 IronStone 这样的业界新人和 YC 这样的孵化器大佬也已投身其中,即使业界至今对于“计算机算法是否能够发现下一个乔布斯”这样的问题还未达成共识。纵使像 Google Ventures 这样背后有“数据公司”谷歌的全球最大数据库和云计算做靠山的高富帅,也尚未得到能够放之四海而皆准的标准公式,而如何更准确地量化团队的化学反应及产品的市场吸引力等等因素还是一个亟待解决的行业性问题。

  不过 Google Ventures 声称他们已经在数据分析上获取了相当的进展。他们拒绝公开成果,不过综合各方面信息看来,Google Ventures 的公式或许并没有想象得那么高深:他们通过分析运用诸如创业城市、团队平均年龄、过往创业经历这样的因素来考量每一个潜在的投资机会。不过 Mark Zuckerberg 在成立 Facebook 前只卖过产品原型而无创业经历,甚至 Google Ventures 的俩老板,Larry Page 和 Sergey Brin,如果要用这么一个算法来评测,估计也难以过关。Google Ventures 也颇有自知之明,看感觉 (intuition) 和看顺眼 (chemistry) 仍是他们在投资决策中颇为重要的考量因素。

  KPCB 和红杉这样的高级玩家也尝试过通过分析创业公司在 Twitter 上被提及次数,或者创业公司产品 App Store 排名这样的数据来分析一家创业公司的价值。而 IronStone,这家由William Hambrecht创立的被视为异类的创投,在数据分析上走得比同行们更远更快。根据一些已经公布的信息,他们声称一个创业公司的团队因素只会在他们的整个考量过程中占到 12%,即使团队和人员长期以来被传统创投视为最为重要的一项影响因素;而另外 20% 被分给了创业公司的其他各项指标,余下的 68% 则全部被市场因素占用:将要进入的市场的环境、公司的调整周期、市场的变化是否可被预期等等。

  目前已知的或公开声称正在或将要使用数量分析来投初创公司的主要机构包括上文提及的 Google Ventures、KPCB、Sequoia Capital、IronStone、Y Combinator,以及 500Startups、August Capital、Accel Partners、Andreessen Horowitz、Floodgate Fund、Greylock Partners、SVAngel 等等。其中,Accel Partners 专门拨出 1 亿美元作为大数据基金 (Big Data Fund),而 Greylock 已在使用其内部数据团队制作的专有数据分析工具。Google+、Facebook 和 Twitter 等社交网络是目前被作为数据采集的主要源头。

  传统的 VC 决策流程,可以大致划分为 5 个阶段:

  潜在的市场有多大?

  潜在的市场机会有多少?能从竞争对手处抢到多少市场份额?

  潜在的商业模型是什么?营收和利润能达到什么水平?

  保守估计,潜在的运营/产品成本有多少?通过这轮融资能够满足团队运营的周期?

  5至10年内是否会有潜在的退出机会或IPO机会?

  最重要的是大部分 VC 在拍板前,还会自问:我是否喜欢这个团队 / 这个团队是否值得投资?

  而在引入了数据分析之后,这个流程会受到什么样的影响?下图是我根据经验以及整理各个 VC 大佬们的文章后制作的一张图表,反映了美国的主流 VC 在不同投资阶段主要用到的有关数据分析的工具。

  

1.jpg


  举例来说,一家提倡数据分析投资并专注于早期投资 (early stage/seed stage) 的 VC 会在初期寻找投资目标时通过AngelListSeedsummit这样的初创公司数据库进行海选,之后利用CapLinked之类的流程管理平台建立联系关系网并设定一定的筛选投资流程。目前针对早期公司的量化评估还未出现什么靠谱的工具,不过有些 VC 会用一个叫YouNoodle的来搜集一个初创公司的竞争对手的信息,以此评估该团队的市场竞争力。OwnYourVenture则提供了一个平台,VC 和创业者可以在输入相关数据后得出几轮投资后的股权价值分配情况。而在某轮融资结束后,VC 可以自建数据库以跟踪所投公司的运营,也可以通过Startup Genome这样的平台来跟踪公司信息或当地创业市场。

  在此不得不重点介绍下CB InsightsPitchBook。CB Insights 作为一家有着金融行业背景的纽约初创数据公司,在集成行业数据和数据分析上做得相当出色,他们定期的行业数据分析报告为 VC 和其他相关媒体机构广为应用,而他们推出的不少可视化数据分析工具也颇有价值。PitchBook 也有着出色的可视化数据平台,但是他们的产品则针对各初创公司提供了更为具体的信息,丰富的 VC 数据库也为创业者和投资者们提供了检视各家 VC 具体信息的平台。当然,36Kr+数据库对于国内的 VC 和创业者们来说是一个很好的工具,我们也会不断改进完善我们的数据库、添加新的功能,以更好地服务国内的创业者和投资人们。

2.jpg
CB Insights的可视化数据库


3.jpg
PitchBook所提供的VC信息界面

  凭心而论,目前这种规模的数据分析或许无从谈及大数据,但是倘若将待分析的数据库规模扩大 10 倍,甚至 100 倍,大数据这样的技术就足以让极大地提高创投的反应速度,而至于结果的质量,或许需要一个相对长的时间来给我们答案。移动技术快速发展产生的大量数据则是一个很好的案例。都说移动技术的发展正在极大地改变每一个行业、甚至每一个人的生活,这一样可以用在创投界。大数据的时代才刚刚来临,而移动互联网和移动设备产生数据的能力和潜力是难以预估的,最好的例子便是在刚过去的双十一里,淘宝有15%的交易额来自移动端。对于想要掌握用户需求和习惯的创业者,以及希望发现有成长潜力的产品和创业者的 VC 们来说,这个时代或许会是一个前所未有的黄金时期。

  对 VC 来说,手头有了数据之后,问题就在如何有效地分析数据并量化评估标准。举例来说,一个房地产投资人可以用Case Shiller房价指数这样的量化指标来衡量当前的市场环境,用公开数据和政府文件来评估某家具体开发公司的运营状况;而专注于投资上市公司的投资者,简单的标普 500 指数和某家公司的市盈率就能勾画出一个投资机会的轮廓。对于 VC 和天使投资人来说,这样的画面在投初创公司的时候是难以想象的。VC 的尽职调查 (Due Diligence) 很多时候只能通过投资者的人际网交流和主观感受来完成,而不是像投行们那样甩出成摞的 Excel 和精美的尽职调查报告。纵使诸如 CB Insights、Crunchbase、AngelList 这样的数据平台的大量出现能够改变 VC 们以往那种缺乏数据的生活,但是如何选择数据、如何将数据转换成有用的信息,则是 VC 们的下一个难题。

原文发布时间为:2013-12-21


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
26天前
|
数据挖掘 Python
【Python】数据分析:结构化数分工具 Pandas | Series 与 DataFrame | 读取CSV文件数据
【Python】数据分析:结构化数分工具 Pandas | Series 与 DataFrame | 读取CSV文件数据
23 1
|
4月前
|
SQL 人工智能 JSON
你必须掌握的Python数据分析工具之Pandas
你必须掌握的Python数据分析工具之Pandas
|
4月前
|
机器学习/深度学习 存储 人工智能
你必须掌握的Python数据分析工具之Numpy
你必须掌握的Python数据分析工具之Numpy
|
6月前
|
机器学习/深度学习 监控 数据可视化
想要使用Python进行数据分析,应该使用那些工具
想要使用Python进行数据分析,应该使用那些工具
48 0
|
12月前
|
数据可视化 数据挖掘 数据处理
|
机器学习/深度学习 人工智能 数据可视化
一键自动化数据分析!快来看看 2022 年最受欢迎的 Python 宝藏工具库! ⛵
探索性数据分析(EDA)在机器学习中至关重要!这些高效又绝美的宝藏库,快用起来——Matplotlib、Seaborn、Plotly、Bokeh、Altair、pandas-profiling、Sweetviz、AutoViz、Microsoft Power BI、Tableau!
2800 1
一键自动化数据分析!快来看看 2022 年最受欢迎的 Python 宝藏工具库! ⛵
|
SQL 数据可视化 数据挖掘
深度讲述6款 “数据分析” 工具,告诉你数据分析应该学这个!
深度讲述6款 “数据分析” 工具,告诉你数据分析应该学这个!
深度讲述6款 “数据分析” 工具,告诉你数据分析应该学这个!
|
SQL 数据采集 供应链
Python结构化数据分析工具Pandas之Pandas概览
Pandas是做数据分析最核心的一个工具。我们要先了解数据分析,才能更好的明白Pandas。
156 0
|
Web App开发 XML 前端开发
5款前端开发数据分析工具
5款前端开发数据分析工具
5款前端开发数据分析工具
|
机器学习/深度学习 数据采集 人工智能
Python数据分析 | seaborn工具与数据可视化
对于使用Python快捷地进行数据分析可视化而言,Seaborn是一个简单易用的选择。Seaborn 核心库进行了更高阶的 API 封装,可以轻松地画出配色更加舒服、图形元素的样式更加细腻的图形。
432 0
Python数据分析 | seaborn工具与数据可视化
热门文章
最新文章
推荐文章
更多