深层数据:推动大数据成功的关键所在-阿里云开发者社区

开发者社区> 小旋风柴进> 正文

深层数据:推动大数据成功的关键所在

简介:
+关注继续查看

FirstFuel公司CTO表示,寻求规模更小、更具相关性的浓缩型信息是解开大数据无穷潜力的关键所在。


毫无疑问,大家肯定都听说过“大数据”,但“深层数据”呢?答案恐怕是否定的。不用紧张,我并不打算给硬塞给大家新的专业词汇。不过鉴于近期以来企业用户正持续就需要收集并管理的数据量展开争论,我认为深层数据的概念应当进入各位关注数据潜力的企业用户的扁当中。专注于建筑行业能源利用效率的分析企业FirstFuel公司CTO兼首席数据官Badri Raghavan对此有着自己的独到见解。该公司的客户们,包括政府机关与能源机构,都在使用FirstFuel的能源分析服务以推动更为环保、更具成本效益的方案向办公环境、学校以及其它设施建设领域的普及。


在一次电话采访当中,Raghavan谈到了他对于“深层数据”的看法以及FirstFuel公司如何将这一理念转化为自身竞争优势。


“我们所谓的‘深层数据’其实是相关领域多种专业性知识储备的综合体——对于我们来说,也就是能源行业与数据科学的结合——旨在帮助技术人员从宏观规模角度对建筑的能源使用情况作出分析,”他告诉我们。


深层数据的概念与信息密度拥有密不可分的关联。“给定数据流当中可能包含大量信息,”Raghavan表示。“相反,大家也有可能收集到大量缺乏足够结论性内容或者信息的数据。”


大家可能已经猜到了,Raghavan本人对于数据收集或者尽可能汇总更多信息的作法并不认同。但目前很多企业都是这样做的,即在尚不确定是否有意义的情况下盲目汇集规模庞大的数据总量。


数据收集的真正核心在于效率,或者说“对目前已经掌握的数据资产加以利用。要实现这一目标,我们需要首先明确自己需要解决哪些技术或者业务难题。在大家可资利用的资源当中,哪一种数据流的作用最为重要?”


在FirstFuel所从事的行业当中——即分析大型建筑物的能源消耗情况——单一数据流往往成为最重要的计量数据。


“我们会把计量数据作为一栋建筑物的扫描结果。利用我们的数据科学算法,我们可以对建筑物的健康状况作出分析、找出其中的薄弱环节以及仍有效率提升空间的部分。”


他指出,这就是深层数据实际起效的一类极佳实例。计量数据是“一种相对精练的数据流,但其中包含的内容却相当丰富,”FirstFuel得以借此定位其最感兴趣的问题:找出能源消耗当中有违效率优先原则的状况。


当然,对于很多企业来说最重要的是摸清哪些数据流最具分析价值,而后还需要将其与其它数据加以结合以获得新的分析结论。


FirstFuel已经找到了几种通常最具潜在价值的数据流类型。

“计量数据能够告诉我们与建筑物相关的大量信息,”Raghavan指出。“接下来我们开始使用高分辨率航空影像——是的,就是谷歌地球,我们在工作中大量使用这类资料。从我们的角度来看,其中包含丰富的潜在信息。它能告诉我们这些建筑物楼顶布置有哪些类型的设备,”而FirstFuel能够借此大体判断对应建筑物需要消费的能源总量。


这家分析企业还将来自国家气象服务中心的数据纳入考量范畴。“我们着手进行设置,并逐步逐步再逐步将其引入。只要能够对信息分析结论起到改进作用,我们就会将相关数据流纳入考量。”而根据他的说法,这就是深层数据的基本概念。“大家可以对规模相对较小的数据集进行深层研究,而不再像过去那样长期面对浩如烟海的数据总和……并试图从其中捞到象征有价值结论的小针。”


举例来说,FirstFuel完全可以收集多种额外数据——其中包括与交通流量及泊车状况有关的信息,此外Twitter数据流也有涉及——但事实上根本没有明确的理由驱使他们选择这样费力的方式。


“相对于直接跃入存在海量数据可资进行潜在分析的大数据海洋、却往往最终几乎甚至完全得不到有价值信息,我们更倾向于从规模相对较小的数据量中获得更大收益——即将注意力集中在那些能够切实反映建筑物客观状况的数据身上,”Raghavan指出。“在制定出这样的解决思路后,接下来我们会逐步把想法变成现实。”


原文发布时间为:2014-08-01

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【前台 乱码】 前台单独乱码+后台往前台传输的数据乱码
解决方法: 第一:      这句话是加在每个页面的最上面,在之前加的  并且  request.setCharacterEncoding("gb2312");第二:   配置Tomcat的 server.xml。
829 0
C# List的数据字典作用
    有时候需要使用一个数据字典的表来罗列大批的数据,这时使用List是比较好的方法。 class Program {     public static Liststring> STAR...
710 0
通过阿里云数据中台读懂消费者,香飘飘实现新客增长3.5倍
从9月份开始,香飘飘就为此次双11进行营销蓄水,并通过与阿里云数据中台合作,形成一套全域数据中台解决方案,统一运营自身的全域消费者资产,最终在拉新上实现了3.5倍的增长。
6175 0
同样指令bmp.LockBits不同平台(Windows/WinCE)获取位图的数据不同
同样指令bmp.LockBits不同平台(Windows/WinCE)获取位图的数据不同
325 0
图的单源最短路径,Floyd算法(数据结构c++)
这个算法结构很是简单,但是理解还是有一定的困难,一开始做的时候想不明白,跟着算法自己动手画画就知道这个算法具体是怎么回事了。 时间复杂度是O(N*3) 算法有点动态规划的意思,有两个数组,一个(dis[])是记录俩顶点之间的最短路径的长度的,一个[path]数组是记录俩结点的中间结点的。
728 0
2728
文章
6591
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载