我现在从事的是知识产权工作,接触的也是专利数据较多,之前在工程设计院接触的也都是工程数据,不会算法,也不懂存储。所以今天我可以以第3视角给大家分享一下我眼中的大数据,仅代表个人观点,见识有限,欢迎大家一起学习讨论。
现在的大数据研究更偏向于可以直接间接归纳整理的运算逻辑数据。实际上很多存储在网络里的有价值的文献数据的利用也刚起步,包括了视频,音乐,文章等。这些数据的价值会随着国内版权意识和专利权意识的提升而越来越扩大化。
文献数据本身价值来源于原创性和基础性。成果做到尽可能多的独立原创,又能被别人更可能多的引用,甚至用做基础进行二次开发,跨界商用。我最近开始学习怎么做专利情报分析,需要懂的专业知识很多。下面继续谈当下的大数据。
即使是在大数据工具当前运用较广的消费市场运用方面,也是有缺陷的。这里就和好多人有识之士的观点一致了,大数据再美也只是工具,做判断的还需要人。
我引用曹建辉老师在《卓越领导者》第60页的一段话:
第二,不凭数据,而凭眼光和感觉。这五位卓越领导者在判断行业未来的市场前景以及客户的需求趋势是,没有一个人用到大量的数据,只有对行业的认知,感觉基础上的“认为”。事实上,新兴行业没有经验数据可依;已有的行业,未来也绝不会复制从前,不会按原有模式发展下去。所以绝不可依赖已有的数据,未来的变化和趋势从来都不是根据数据模型和数据推测出来的,而必须凭眼光和感觉来判断,这才是看待和选择行业的根本。
其实不光是看待和选择行业。在很多事情上,数据模型做的再好,分析的再合理,也不从来不能是我们的决策的根本依据。就像36大数据里群友讨论的大家都惊叹于亚马逊中国大数据做的多好(国外公司是有购买数据分析报告的习惯),但在中国还是被淘宝给干翻在地。这就是典型的分析报告无效的案例。甚至报告往往得出的结论是错误的。
下面有个例子是知识产权方面的。
在最近的一次日本律师事务所分享报告上,在日本专利的长篇数据图表分析之后,他补充说明了一句,这个图表不能判断日本专利诉讼的很低。还要考虑日本的特有的文化,还有日本商会很多都是百年老店,经营管理思维偏向传统。一般专利侵权行为也都不会追究,即使追究也是发函给你,认错态度好就可以。认错了,对于这些老店来说就是胜利了,也就没必要再对簿公堂。上法庭会被认为有损老店形象了。侵权时态度诚恳,甚至侵权费可能也会少要,甚至免了。当然这个只是就当下的,近年来日本文化一直也在演变。所以大家别真的主动在日本侵权,真正撕破脸,上法庭赔偿金额,会非常高的。律师那天举例的最近年糕专利的故事,赔偿金额我当时没拍照,应该是不到8000万,应该是日元吧,数字仅做参考。不过另一方面可以确切的知道,日本人是有多爱吃年糕。告成功后又告了一家,又成功了。不知道这又会对未来日本专利诉讼的境况会产生多大的影响。
所以在大数据概念日益火爆的今天。我们在惊叹于这些大数据分析技巧,和得出看似真相的结论的同时,要保持相对清醒的头脑,更多时候还是要回归到技术知识,市场前景本身,理性冷静的做判断,不能过依赖。尤其是金融业,即使通过复杂的计算,各种的包装美化能卖出产品,产生一时的利润,也要考虑其合理性。极端的案例就是,08年华尔街的金融天才们就是玩转了整个世界又能怎么样。
那大数据未来怎么发展呢?
14年知识产权报文章《创业板企业在大数据领域的技术与专利现状分析》节选:
第一类是与海量数据存储和处理相关的企业;
第二类是与数据中心建设相关的企业;
第三类是与行业数据应用相关的企业。
遵循“数据采集、数据存储、数据检索、数据分析和数据应用”的大数据产业链,而分布式存储管理、实时计算、非或半结构化数据处理、基于云平台的数据挖掘、数据可视化和数据产品应用等则是该大数据产业链中的关键技术。
未来专利申请的方向
数据获取及数据分析方法:随着全球企业竞争不断深化,数据已经成为企业的核心竞争力,谁掌握数据,谁在行业领域就有发言权。但数据必须通过不断积累才能形成大数据,大数据必须通过各类分析方法的应用才能形成价值,特别是大数据的实时分析,需要面对瞬息万变的市场,及时做出反应。因此,在专利申请方面要注重对数据获取和数据分析方法的保护。
非结构化和结构化数据的集成:随着海量、多类别数据的涌现,企业中的数据已经不是单一的以文本为主的结构化数据,还包括图片、声音、视频、地理位置等各种类型的数据。据统计,目前85%的数据属于非结构化数据,如何统筹考虑传统的结构化数据和非结构化数据的融合和整合,挖掘出两类数据中的关联价值,也是专利申请的方向之一。
基础大数据平台建设:在对上述企业专利分析的过程中我们也看到,涉及大数据基础平台的专利申请比较少,这与我国基础研究相对落后相关,但同时我们也看到,在一些企业中已经把大数据基础平台的研究作为了重要的方向,因此,在进行技术研发的同时,一定要注重对核心关键技术进行适时的保护,这不仅是企业在大数据领域竞争的基础,也是企业发展的保证。
知识产权报从专利的角度解读了大数据发展方向。尤其认同数据关联价值这个说法。之前我工作几年的部门就是设计院内的工程数据中心,我们当时最有价值的工作就是做设备关联关系表。以工程文件中的设备位号关联设计图纸,3维模型,厂家设备文件等。
数据关联后,在不同的地方,不同的领域往往能产生更大的衍生价值。在发明专利里也有类发明叫用途发明。技术的跨界运用有时能创造巨大的社会价值。这方面主要药品领域案例较多。这里举个比较直观的,类似但不能新申请专利的新用途事例。行车记录仪的新用法:最近有美女叫老公去看行车记录仪,告诉他要当爸爸了,怀孕了。前文中的日本年糕专利的案例这则信息,他们的实际赔偿金额是通过严格计算的,侧面我们也就能知道市场销量。
海量数据存储和处理;数据中心建设也很重要,这是工具,是技术基础。个人看但这个相对中小企业来讲长期看并不实际,这块终将会只剩几个大玩家。大数据时代给我们的会有很多新的可能,大到有报道已有飞机场利用大数据给每个飞机计算单独的航线,小到利用大数据真正实现量体裁衣。
所以相信未来的大数据会加速渗透到各个行业领域。量化我们的生活行为,更加深度的挖掘创新并满足我们生活需求。其中已经入侵和并影响了我们运动出行,饮食习惯,社交等的个人数据。
最后,当下我们就能看到的是有关大数据很多事正在发生着,比如正在重建社会信息体系(各种互联网金融的白条),剥去银行保险业的神秘内衣。但大家对大数据也不要报太多期许,能颠覆很多行业。当年发明出留声机后就有预言广播这种只能被动听声音的会被取代。但事实呢?都发展的很好。
补充:最近大家很期待政府的大数据,其实政府的大数据一是每年花大量的人力物力去普查,但考虑到体制和立场问题,公开并不一定准,比如失业率。就算是公开的也会很有限的。譬如下面的党员不能买卖股票的新闻。还是很大部分数据真正涉及利益的数据是不可能会公开的,所以大数据的来源还得主要靠自己。
最近看到新闻,中纪委回应党员能否炒股:四类人员不能买卖股票
一是上市公司的主管部门以及上市公司的国有控股单位的主管部门中掌握内幕信息的人员及其父母、配偶、子女及其配偶,不准买卖上述主管部门所管理的上市公司的股票。
二是国务院证券监督管理机构及其派出机构、证券交易所和期货交易所的工作人员及其父母、配偶、子女及其配偶,不准买卖股票。
三是本人的父母、配偶、子女及其配偶在证券公司、基金管理公司任职的,或者在由国务院证券监督管理机构授予证券期货从业资格的会计(审计)师事务所、律师事务所、投资咨询机构、资产评估机构、资信评估机构任职的,这些党政机关工作人员不得买卖与上述机构有业务关系的上市公司的股票。
四是掌握内幕信息的党政机关工作人员,在离开岗位三个月以内,继续受该规定的约束。
本文作者:李源
来源:51CTO