10个大数据案例

简介: 如今全球数据量正迅猛增长,每十八个月总量就会翻上一倍。就在不知不觉之中,我们身边的现实世界已经开始转向由大数据驱动的新时代。在今天的文章中,我将带大家一同回顾十大大数据部署实例。 关于大数据话题的炒作与争论似乎永无停歇,但全球数据量迅猛增长、每十八个月总量翻上 一倍的客观现实却没人能够否认。
0.jpg

如今全球数据量正迅猛增长,每十八个月总量就会翻上一倍。就在不知不觉之中,我们身边的现实世界已经开始转向由大数据驱动的新时代。在今天的文章中,我将带大家一同回顾十大大数据部署实例。

关于大数据话题的炒作与争论似乎永无停歇,但全球数据量迅猛增长、每十八个月总量翻上

一倍的客观现实却没人能够否认。对这些新增数据的利用已经延伸到我们生活中的几乎各个方面,只是有些相对直观、有些却在悄然发生。今天我们就来一同回顾那些不为人知却实际存在的十大大数据部署案例。

 

Netflix

1.jpg

 

Netflix已经成为美国国内规模最大的商业视频流供应商——目前拥有2900万视频流客户。这家公司同时也成为吸收新增数据的海绵——用户在看什么、喜欢在什么时段观看、在哪里观看以及使用哪些设备观看,爆增的信息量成为Netflix手中的宝贵资产。他们甚至掌握着用户在哪视频的哪个时间点后退、快进或者暂停,乃至看到哪里直接将视频关掉等信息。现在Netflix公司开始推出自己的原创节目,而节目制作的依据正是刚刚提到的这些数据。他们利用手中的数据说服BBC重新翻拍了电视连结剧《纸牌屋》;而且将演员Kevin Spacey与导演David Fincher的粉丝与原剧集支持者的粉丝进行关联,最终让这二位加盟新剧的拍摄。

Ancestry.com

2.jpg

Ancestry.com帮助人们将自己与家庭史结合起来并创建独一无二的树状家谱。从表面上看,这个主意似乎没什么技术含量,但为了实现这项功能、网站需要维护超过110亿条记录与高达4PB的数据量——其中包括历史记录、出生记录、死亡记录、战争与移动记录甚至年鉴等——其中不少往往采取手写格式。它利用高级内容处理技术对全部相关信息加以索引,从而保证数据的可搜索性。Ancestry.com还引入额外的DNA处理结果以生成新型数据流,从而帮助客户更准确地建立血缘关系。通过对唾液进行采样,网站方面能够对客户的DNS进行排序并将结果与数据库中的其它客户加以匹配——例如找到多年没有联系的表亲。 

西奈山医疗中心

3.jpg

西奈山医疗中心是美国历史最悠久、规模最大的教学型医院之一,其在医学教育与生物医学研究方面的地位非常突出。目前中心方面正利用来自大数据新兴企业Ayasdi公司的技术对整个大肠杆菌基因组序列进行分析,其中包括超过100万个DNA变异,旨在努力理解某些菌株如何在与抗生素的共处中获得抗药性。细菌的抗药性影响着全球各地数以百万计的病人。Ayasdi的技术为数学研究、拓扑数据分析(简称TDA)开辟了一片新天地,有助于人们更深刻地理解数据形态。

 

加利福尼亚州ISO

4.jpg

加州独立系统运营商(简称ISO)管理着全加州地区超过八成电网中的供电走向,每年提供的电力达到2.89亿千万时、惠及3500万民众,供电线路的总长度超过25000英里。他们利用Space-Time Insight公司的软件实现情景智能化机制,从而将来自多个来源的大规模数据进行关联与分析——其中包括天气状况、传感器数据以及计量设备测绘结果等——并以可视化形式帮助用户查看并理解如何对可再生能源进行优化、实现整个电网的电力供需平衡并快速应对潜在危机。

 

Hydro One网络

5.jpg

Hydro One公司负责为全安大略省的家庭及企业提供电力。该公司拥有并经营安大略省内总长达29000公里的高压输电网络以及总长达123000公里、直接面向130万用户的低压配电系统。Hydro One使用的是由Space-Time Insight提供的地理空间与可视化分析软件,旨在改进当前输电与配电资产的健康性与可靠性。这套系统能帮助资产管理者及时获取相关情报,包括资产性能随时间推移而发生的变化、资产更换战略以及资产维护需求等。该方案还能将数据与其它多种不同系统的功能结合起来,包括SAP ECC、SAP BW、GIS系统以及实时数据等,从而帮助Hydro One对自身拥有的资产具备宏观掌控能力。

 

俄勒冈健康与科学大学

6.jpg

俄勒冈健康与科学大家(简称OHSU)是位于美国俄勒冈州的一所公立大学,下辖两所医院、一座一级创伤恢复中心和一家儿童医院。校方将Stanley Black与Decker Disivion Stanley Healthcare提供的MobileView软件与Tableau软件的数据虚拟化技术结合起来,旨在追踪院内4000个注液泵的实时位置与工作状态,从而掌握注入到患者循环系统当中的液体、药物或者营养物质——事实上,这项工作如果完全依靠手动方式执行、其可靠程度将大打折扣。该技术还允许校方对历史及当前资产数量进行分析,进而更好地规划未来数量水平、提高库存物资的分配与利用效率。

 

拉斯维加斯市

7.jpg

由于记录太过古老、信息不够准确,大部分城市中的公共事业机构都不了解埋在地下的资产处于何种状况——因此居民往往会由于某条供电线被意外切断或者某条供水管线老化爆裂而受到影响。为了避免这些难题,拉斯维加斯市采取智能数据方式开发出一套实时公共事业网络模型。VTN咨询公司帮助市政当局通过各种渠道汇总数据,并利用Autodesk技术创建出实时3D模型。这套模型中包含着地上与地下的所有公共设施,目前已经被用于监测城市地下设施的具体位置以及运转状况。

 

迈阿密市属戴德县

8.jpg

佛罗里达州迈阿密市属戴德县正积极响应IBM提出的智能化城市倡议,希望将35个区域自治单位与迈阿密市聚拢起来,努力帮助政府领导做出更为明知的管理决策——包括充分利用水资源、减少交通拥堵以及改善公众安全等。IBM通过云计算环境下的深层分析为该县带来一套情报仪表板,从而帮助各机关与部门彼此协作并实现可视化管理。举例来说,戴德县县公园部门今年预计将通过识别并修复因锈蚀而漏水的浇灌管道节省100万美元经费。

 

澳大利亚网球协会

9.jpg

在一年的大多数时段内,作为澳大利亚网球公开赛的经营方,澳大利亚网球协会的运作状态与普通的小型企业没什么差别。然而一旦为期两周的澳网公开赛开始进行,协会瞬间就成了一家规模庞大、对数据极度渴求的大型企业——他们需要不间断地访问准确内容、数据以及统计结果,从而进行分析并做出决策。澳大利亚网球协会采用IBM的实时数据分析软件来检查赛程进行状态、运动员人气、历史数据记录以及社交媒体上球迷们对比赛网站提出的数据需求。根据实际需求,这项技术能够为分析工作分配必要的计算资源。

 

DPR Construction

10.jpg

DPR Construction公司是加州大学旧金山分校斥资15亿美元在米慎湾兴建的医学中心的承包商,这也是第一座建造时间超过十年的医学中心。DPR利用来自Autodesk公司的3D技术帮助手下的设计师们收集空气流量、建筑物朝向、楼体间距、环境永续性以及建筑性能等数据,并将结果导入到一套单独的虚拟模型当中。通过这种方式,建筑师、设计师以及旗工队伍能够以可视化方式掌握遍布整个运作环境下的数亿个数据标记。


原文发布时间为:2013-11-20


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
2月前
|
API
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
104 0
|
3月前
|
数据可视化 大数据 数据挖掘
瓴羊荣获2023虎啸奖“年度十大AI&大数据服务公司”“数智营销案例铜奖”双重大奖
瓴羊荣获2023虎啸奖“年度十大AI&大数据服务公司”“数智营销案例铜奖”双重大奖
|
4月前
|
自然语言处理 搜索推荐 大数据
Python大数据之PySpark(七)SparkCore案例
Python大数据之PySpark(七)SparkCore案例
37 0
|
4月前
|
分布式计算 大数据 数据处理
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
大数据开发企业级案例__某通信企业数据处理需求(建议收藏)
34 0
|
4月前
|
分布式计算 Hadoop 大数据
大数据hadoop练习___出租车MRWordCount案例
大数据hadoop练习___出租车MRWordCount案例
24 0
|
4月前
|
搜索推荐 大数据 C++
C++系列案例-大数据减法-绘制余弦曲线-兔子数量-快速排序
C++系列案例-大数据减法-绘制余弦曲线-兔子数量-快速排序
|
5月前
|
机器学习/深度学习 自然语言处理 Cloud Native
探索在云原生环境中构建的大数据驱动的智能应用程序的成功案例,并分析它们的关键要素。
大数据索引: Google使用大数据索引来构建其搜索引擎,并实时处理全球各种语言的文本数据。 云原生基础设施: Google Cloud提供了强大的云原生基础设施,支持大规模数据存储和处理。 自然语言处理: Google使用自然语言处理技术来理解和索引文本数据,从而提供高质量的搜索结果。 实时搜索: Google的
124 0
|
7月前
|
SQL 存储 分布式计算
大数据Hive入门案例
大数据Hive入门案例
54 0
|
8月前
|
弹性计算 负载均衡 并行计算
实战案例分析:ECS在电商和大数据领域的应用
本文通过实际案例分析,深入探讨了云服务器ECS在电子商务和大数据领域的应用。在电子商务网站部署方面,我们介绍了如何使用ECS构建稳定的电商平台,包括弹性伸缩和负载均衡的实践。通过示例代码,读者可以了解如何创建ECS实例、配置负载均衡器,以及设置自动伸缩策略,以应对不同流量情况。
323 1