开发者社区> 行者武松> 正文

写给初创公司的话:数据权限是最有利的IP保护

简介:
+关注继续查看

在人工智能发展的初期,你们都是初创公司。

【编者按】本文编译自”Data rights are the new IP rights”,作者为Mark Gorenberg和Ivy Nguyen两人。

Mark Gorenberg是Zetta Venture Partners的董事总经理。他拥有26年的风险投资经验,资助并在众多初创公司的董事会任职。在创业之前,他曾担任过Sun Microsystems的第一个SparcStation团队的软件执行官。

Ivy Nguyen是Zetta Venture Partners的投资者。 她曾在NewGen Capital担任高级助理,并在Imagine H2O管理启动加速程序。

以下为正文:

现在,很多开发者将其开发的代码、算法等资源公开,导致科技领域很多算法服务类的仿制品可以在数小时之内做出来。软件专利为这方面的原创产品提供了一定的保护,但是雷同产品之争仍然很激烈。

不过,值得注意的是,没有数据的软件本质上就是商品。

随着人工智能的发展,AI和数据的支持显得越来越重要。但如果没有数据,AI也没有太大作用,如每一款AI类的产品都先需要数据来训练出算法的最基本性能(MAP),然后再向潜在客户展示算法的性能表现,这样新客户带来更多数据,用于提高算法性能,吸引更多新客户等。

这种反馈循环的每一次迭代都会造成更多的竞争,因为继续获取可用数据对于保持此反馈循环的发展至关重要。因此,我们应当认识到,数据权限已经成为新的知识产权。同时,这为新兴创业公司带来了机遇和挑战。

写给初创公司的话:数据权限是最有利的IP保护

初创公司具有“从头开始”的优势

此前,当很多用户毫不犹豫的将自己的数据存储在云盘等云平台上,却有多家公司因为数据存储和维护的成本之高,而选择放弃了管理用户数据的权利。许多类似的协议在今天仍然存在,因此造成了许多企业获取的数据并不全面,从而阻碍他们将人工智能应用于其云产品的尝试。

现在,我们步入了人工智能时代,更多的用户让第三方管理他们的数据,以确保其可以将更多的精力放在他们的领域。

人工智能的具体应用过程需要公司不间断的获取数据,然后对数据进行清理、设置标签、查询和分析,以实现预测功能等。因而如今很多创业公司在已有的数据基础上尝试获取更多的数据权限和资源。

并且许多将数据存储到云供应商的企业认为初创公司构不成威胁,会共享其深入的数据访问权限,因此相对而言,初创类公司拥有更多的自由和选择。

一开始就用好数据,进入良性循环

对于AI类初创企业,在最初与客户谈判数据权限方面问题时应当抢占先机,抛出反馈循环带来的数据需求问题,利用其价值来要求尽可能多的数据权限。

在许多产品应用中,初创公司最初可以通过寻找优质的数据源来训练学习算法,以此让算法从一开始就进入一种良性循环。以下是一些可以尝试的方法

1.针对中小企业和中端市场的客户,因为他们往往对数据权限持开放态度,可以低价的优质产品来交换数据,此外,将这些小客户的数据拿来训练所花费的代价,可以作为后期谈判大客户的参考。

2.雇用专人来负责对算法的训练事宜。

3.找外部来源的数据,如来自政府机构的公开数据集,或从Clearbit等第三方供应商处购买数据,还可以看看相关网站和社交媒体。

4.提供旗舰产品的免费增值版本,以捕获用户参与度数据。

5.以成本价出售优质的产品,以此获得数据。如特斯拉,他采用的策略就是为了建立一个庞大的数据集来训练自动驾驶汽车。

事实证明,这些外部数据源中的数据,很多都可以将学习算法训练到足够高的性能水平,来让初创公司向其客户展示算法的价值,以吸引更多的客户来使用。

但是,在人工智能的大背景下,创业公司拥有专有数据管道是必要的。因为这样,公司的算法产品就可以从客户网络中的汇集学习中获得复合效应,从而使新进入该领域的公司和新兴模拟者难以追赶。

现状与策略

虽然初创公司在获得更多数据权限方面比个人有优势,但想要达到目标并不容易。以下是一个典型案例:

一家初创公司具有令人难以置信的新型AI动力工作流程演示,与传统企业相比,这套系统可以节省企业数千个员工的工作时间。据该公司的演示,利用历史销售数据训练了该算法,该系统可以帮助公司预测新的销售潮流,并给出最佳的销售时间点的建议。

但这个华丽的演示最终还是让客户企业离开了,这笔交易就这样不了了之。因为当企业已经准备好购买并在全公司范围内推出解决方案的时候,交易的审查过程中,因为数据安全等问题,律师等人是不同意采用的。他们表示没有办法允许该初创公司访问他们的数据,以免数据落入竞争对手的手中。因此一旦没有相关数据来进行训练,该产品对企业用户来说就不那么有价值。

所以交易开始前,初创公司需明确表明,他们的兴趣在于从数据和数据流中学习(如用户参与度、交互数据、元数据、数据流量信息等),而不是聚合客户的数据,然后将其转售给第三方。开始阶段,数据权限的谈判是最困难的,但随着时间的推移,随着大家对此方面认知的加深,这一过程会变得更加容易些。

总结

在云数据时代,公司通过发布新功能来进行竞争,这些功能很容易复制,因此,绝对的市场占有率更难实现。从一开始就进入数据积累的良性循环,这将为企业成为最后的赢家提供一个保障。为了实现这一点,初创公司的目标应该是获得数据的独家权利,积累客户数据,形成合作伙伴关系。

大家需要明白的是,在积累了大量数据之后,现任和新兴的竞争对手都无法通过其他方面来弥补这一方面的差距。数据使科技公司在历史上第一次有机会建立强大的保护,防止传统的老牌企业和新兴的模仿者超越自身,并且这样的保护能力也远远超出了传统的知识产权战略所能提供的保护。


原文发布时间:2017-10-19 17:33
本文作者:Lynn
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
海量数据,3行Python代码直接获取!
海量数据,3行Python代码直接获取!
3 0
2020总结,迎战2021,大三专科转Java挑战阿里大厂面试
文章标题我有点夸大,但是我要声明:不管最后能不能去阿里,如果我们的个人技术能力能达到阿里的面试水准,我相信大多数公司都会给你发offer。所以阿里面试是我的一个目标与进步的动力。所以这也是我为什么从写一些项目坑转到写一些Java的类,包,库的一些底层实现原理以及面试的原因。
5 0
你知道学校里的MySQL与社会中的MySQL有啥区别吗?(详解一)
本文经验都是我看书学习的总结的一些经验,面试常问的知识点,所以请观看学习!下面已经给出了书的目录!今后将按目录的顺序继续更新学习心得!
4 0
你知道学校里的MySQL与社会中的MySQL有啥区别吗?(详解二)
本文经验都是我看书学习的总结的一些经验,面试常问的知识点,所以请关注后再继续观看学习!下面已经给出了书的目录!今后将按目录的顺序继续更新学习心得!接上文继续分享
4 0
长文预警,一篇文章扫盲Python、NumPy 和 Pandas,建议收藏慢慢看
今天我们来一篇超级长文,一次性扫盲Python、NumPy 和 Pandas
4 0
你知道学校里的MySQL与社会中的MySQL有啥区别吗?(详解四服务器性能剖析)
本文经验都是我看书学习的总结的一些经验,面试常问的知识点,所以请关注后再继续观看学习!下面已经给出了书的目录!今后将按目录的顺序继续更新学习心得!接上文继续分享
4 0
借助 PyPDF2 库把数据分析系列教程文章制作成了PDF电子书,欢迎来领取!
PyPDF2 库,顾名思义,就是用来操作PDF文件的,相信网上已经有太多相关的介绍文章了,我这里就不再赘述了。这里只重点一下制作书签的过程,网上好像还没有比较详细实用的文章!
3 0
Redis你能跟面试官聊哪些?
以上文章讲述的是【数据库性能调优知识与面试知识(详解四服务器性能剖析)】接下来我总结一下【Redis入门知识点】。
4 0
干货 | 2021 年如何一步一步的学习 Python
干货 | 2021 年如何一步一步的学习 Python
5 0
前端面试常问cookie、session、localStrorage、sessionStrorage区别以及应用场景
以上文章讲述的是【线上系统打如何正确打日志】接下来我总结一下【前端面试常问sessionStrorage、localStrorage、cookie、session的区别以及应用场景】。
2 0
+关注
行者武松
杀人者,打虎武松也。
17142
文章
2569
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载