在市场前景一片利好的情形下,大数据也走上了“商业化”道路,在将之用于更多应用的同时,网络安全也需时刻维护。
此前,研究机构IDC预测,全球大数据(Big Data)与分析市场规模将由2015年的1220亿美元,在5年间成长超过50%,并在2019年底达到1870亿美元的规模。
进入2016年之后,人工智能、物联网、VR/AR等前沿科技对于数据的依赖性,让人们看到了大数据的价值所在。当前,大数据成为了多数项目和应用的必备之一,而在未来,基于此的项目和应用只会越来越多。
入局者众多,玩转大数据
除开像BAT、华为、IBM、谷歌、微软等众所皆知的大腕之外,大数据还有许多玩家,在业务上,他们或是大数据挖掘,或是数据架构,或是数据可视化。
国内玩家
四维图新
作为一家提供导航地图、地理信息系统软件建设的内容提供商,四维图新正在向大数据方向前进。就在9月份,其正式对外发布了交通信息大数据产品“四维交通指数”。
小视科技
一家世界领先的基于机器学习技术,为各行业提供大数据服务的公司。覆盖了数亿用户网络数据,与数十家物流公司达成了合作数十家物流公司,能够实现数千家网络公开信息的实时爬取。
神州融
神州融整合了国内权威的第三方征信机构和电商平台等信贷应用场景的征信大数据,通过覆盖信贷全生命周期管理的顶尖风控技术,为微金融机构提供大数据驱动的信贷风控决策服务。
明略数据
以自主研发的大数据平台MDP为基础,围绕关系挖掘DataInsight、商业智能Discovery、数据关联分析SCOPA等核心产品,提供一系列数据深度分析平台和软件,帮助政府、税务、公安、金融等客户,整理、分析、利用不同来源的结构化和非结构化数据,挖掘数据间的关联价值。
东软
东软大数据战略以医疗行业为突破口,凭借在社保、医疗行业积累的资源,搭建了东软熙康这一智慧医疗平台。此外,其在今年还发布了RealSight大数据高级分析应用平台,直指企业级大数据应用。
国外玩家
Walmart
最早通过利用大数据而受益的企业之一,曾经拥有世界上最大的数据仓库系统。通过对消费者的购物行为等非结构化数据进行分析,Walmart成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。
StreamSets
一家解决管理动态数据挑战的公司。StreamSets开发的软件能够防止“数据漂移”的潜在问题——数据在源头的时候可能会遇到这种不可预测的突变情况,并在应用使用这些数据的时候出现问题。
Talena
提供“永远在线”的大数据管理软件,帮助企业保护有价值的数据资产,并基于关键业务应用快速迭代。今年3月,Talena发布了ActiveRx预测分析基础设施,解决了如何将机器学习用于预测数据可用性、如何将备份数据转变为动态数据资产的问题。
Palantir
该公司主要业务是为政府、金融机构、医疗机构提供数据分析服务、数据安全服务以及其他数据解决方案。据称,其在抓捕本·拉登的行动中,发挥了情报分析的作用。
盛行之下,大数据未来趋势
商业化道路一走到底
在市场需求及规模的推动下,“大数据”已经不再是一个单纯的技术名词,而是一个正在商业化的产品。
早前,为了自身的发展需求,一些公司会组建大数据分析团队,基于数据的分析对自身发展作出指导,在“云计算”出现之后,企业开始将大数据进行商业化,提供相应的储存、分析和计算等服务。之后,看着各项应用对大数据的依赖性越来越难以割舍,更多的人看到了大数据的有利可图。
基于大数据,企业知道了产品的缺陷;基于大数据,企业知道了人们的需求;基于大数据,人们的生活变得井井有条……正如美国著名咨询公司Gartner副总裁、首席分析师Douglas Laney所言,大数据已经充斥了人们的生活,随处可见,而现在大家也从口头对大数据的谈论,变成了如何将大数据业务化、商用化的思考。
“上层建筑”越建越多
目前,基于大数据的分析总结或是训练,一个个项目才能找准市场定位或是改进自身。作为一个“地基”的存在,在商业化进程中,我们明显的看见“大数据”已经不是实验室、金融的专属,而是慢慢的渗透各行各业。
根据前文一些大数据老牌企业或是初创企业的列举,我们可以知悉,在金融之外,交通、医疗、政府、公安等多个领域都已经用上了大数据服务。对于大数据在2017年的趋势,IBM的大数据研究首席科学家James Kobielus表示,最热门的应用将会集中在嵌入式深度学习、物联网、聊天机器人、认知计算、自动驾驶、计算机视觉和语音识别等领域。
以人工智能为例,在其引导下,智能医疗、智能家居、智能出行等多个新兴产业开始崛起,这其中,基于大数据应用的已经不仅仅只有语音识别那么几个单纯的技术了,还包括了各个领域的专业知识体系。基于大数据,各项技术应用只会愈加智能化,此后,随着各项技术在更多领域的拓展和运用,基于大数据的应用只会越来越多。
一切向安全看齐
这年头,用户数据泄露的事情常有发生,就在前段时间,京东被曝出有将近12G的用户数据包外泄,里面包括了用户的账号、密码、电话、QQ、邮箱、甚至是身份证号码。在大数据盛行之下,“网络安全”和“隐私”问题成了一件令人十分头疼的事。
为了应用和技术的改进,企业势必要拿到用户的大数据,这里就涉及到了“隐私”问题,之前,谷歌DeepMind团队的Streams项目(一个软件,向医生和护士推送急性肾损伤患者的消息)不得不中途停止,原因无非是患者担心隐私的泄露。
由于法律条文的漏洞,在一些研究领域,用户信息在未经本人允许的情形下被大量使用,如此做法,只要一个小差错,隐私泄露是必然的。为了降低用户“信息裸奔”的概率,大数据的网络安全保护迫在眉睫。近期,欧盟针对大数据的使用和分析模型的建立出台了一个新的隐私保护法,将在很大程度上避免深度学习领域内由于分析模型乱用导致的意外问题。在欧盟的领导下,大数据的利用将在法律上有所依靠,而用户的隐私也能够得到部分安全保障。
在2017年,人工智能、VR/AR的热度还将继续维持,这也就意味着大数据将更多的被运用起来,在带来更多盈利形式的同时,也推进了大数据的进一步商业化。
不过,大数据可以说是“取之于民,用之于民”,这其中的“网络安全”也是一个难缠的问题。商业化是一条极好的方向,可是,若网络安全都不能维护好,那将给商业化进程添加阻碍,或是造成极大地损失,正如DeepMind团队不得不终止的项目。