大数据应用现状:从发现价值到创造价值

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

大数据

从发现价值到创造价值, 大数据将成为“互联网+” 产业升级的驱动力。 过去,数据的价值主要应用在决策领域,典型应用是商业智能(BI, Business Intelligence)在企业经营管理层面的应用, 即通过数据收集、管理和分析等方法,将数据转化为知识, 发现数据的价值,进而提供决策支持。随着数据体量的不断增加和处理数据能力的提升, 大数据已经成为一类新的资产, 其应用场景正在不断扩宽,除了决策支持、 提高效率等发现价值功能之外,大数据还能创造价值的功能: 一方面,大数据可以帮助提供传统模式下所无法提供的产品, 满足用户需求, 例如大数据完善个人征信体系,帮助金融机构提供消费金融产品;又如千方旗下的掌城科技通过浮动车模型提供实时交通信息服务;另一方面,大数据还可以创造需求, 例如,大数据可以助力实现人工智能, 这是新技术创造的新需求。

大数据延伸 BI 内涵, 提高企业效率

大数据分析结果为企业经营决策提供支持,帮助企业提高效率,这实际上是传统 BI 范畴的延伸。 在人口红利逐渐消失的背景下, 我国企业传统的粗放型模式受到了 越来越大的挑战, 互联网与产业结合背景下的大数据应用将有助于提升企业经营管理效率,助力企业经营从粗放型向集约型转型, 实现产业升级。

大数据促进商业智能的加速发展,这是因为:第一,大数据的分析过程和结果更具有灵活性、可靠性和价值性;第二,大数据的存在提高了企业的商业智能意识, 引导企业主动寻求商业智能的帮助。一些大型企业往往拥有几十个甚至数百个信息系统,其所包含的大量数据反映了企业的日常经营情况,若能加以分析和利用,将为企业创造巨大的价值。

目前,大数据应用可以帮助企业实现户关系管理、盈利能力分析、控制成本、衡量绩效等功能:

客户关系管理(CRM):通过客户信息统计,使企业有针对性的根据客户需求来定制产品和服务,提高客户忠诚度,还可以通过分析偏好挖掘潜在客户;

赢利能力分析:帮助企业分析利润来源、各类产品赢利能力、费用支出是否与销售成正比等;

控制成本:根据统计信息优化流程,如降低库存、减少损耗等,助于企业控制成本;

绩效管理:利于商业智能确立对员工的期望,帮助他们跟踪并管理其绩效。

大数据

大数据

麦肯锡调查显示, 数据挖掘的商业价值巨大, 大数据在美国医疗行业每年能提高 0.7%的生产力,创造约3000 亿美元的价值;在欧洲公共管理部门 ,每年能提高 0.5%的生产力,创造 2500 亿欧元的价值;在美国零售业,每年能提高0.5%-1.0%的生产力 和 60%的净利率。

大数据

大数据满足需求, 市场空间巨大

大数据可以帮助提供过去所无法提供的产品, 满足用户需求。 这种模式在传统产业中比较常见, 过去,一些行业的用户需求虽然存在, 但是由于缺乏有效的技术手段,导致市场参与者无法提供合适的产品迎合市场需求。大数据技术兴起后,将带动一系列创新产品推出市场, 这在各行各业都能找到案例,考虑到传统产业的广度,这将是是一个正在挖掘的巨大市场。

以交通领域的实时交通信息服务和车险定价为例,这两个细分领域的需求本来就存在,但在大数据兴起之前,传统模式无法提供最优的产品,而大数据技术下的产品优化可以更好的满足需求,提高用户体验。

千方科技旗下掌城科技通过大数据技术提供实时交通信息服务。 掌城科技通过向出租车公司和公交车公司购买数据、 向政府部门臵换数据、利用千方自有数据的形式汇集城际交通数据, 基于浮动车的算法模型,对数据进行二次开发,以建立实时交通信息服务平台。 目前, 掌城科技运营着北京、上海等全国 30余个大中城市的实时路况信息,准确率极高。 目前,千方已将交通数据收集从城际交通扩大至整个陆路交通和航空等领域,目标通过大数据技术提供更加全面的公众智慧出行服务。

大数据

大数据技术将参与车险定价,使定价更加科学。随着车联网的兴起,OBD(On-BoardDiagnostic车载诊断系统)等联网的车载设备,成为车联网中的智能节点,连接运动中的人、车和道路环境,读取行车数据,从而分析出车辆能耗、故障等车况信息以及驾驶者的行车习惯:通过G-sensor监测车主的诸如急刹车、急加速和急转弯等危险行为,通过破解Can-bus协议监测车主的诸如转弯不打灯、驻车不拉手刹等不良驾驶习惯,通过GPS获取车辆的位臵信息和里程数据,这些数据将改善车险定价技术与核保政策,提升精准定价能力。

大数据

大数据创造需求,拓宽市场边界

大数据创新产品拓宽市场边界, 供给创造需求。 大数据创造价值功能, 除了提供产品满足市场已经存在的需求外, 基于大数据的新产品还将创造新供给,带动新需求, 打破原有的市场边界,想象空间巨大:

一方面大数据能够前所未有的精准洞悉现在,深入挖掘现有商业价值:

例如 Airbnb 拥有海量的独有数据,包括旅游地、用户评论、房源描述、社区信息等,Airbnb还有一支队伍去各地和当地人交流,搜集所有的相关历史数据。当用户在搜寻一个住宿的地方时, Airbnb 利用大数据分析通过Airbnb 社区告诉未来的客人哪里是更好的住宿地,甚至能够帮助用户更深入地了解某个地点,包括地理信息无法描述的文化或宗教上的区分。Uber 则是利用地理位臵和其用户的综合数据,大大缩短司机开着空车去接下一位乘客的时间和乘客等待的时间。

另一方面大数据能够空前准确的预测未来,从而能获得前瞻性的商业价值:

例如社交数据分析公司 Topsy 准确预测了 iPhone 4S上市后的市场表现,同时还成功预测美国大选结果和奥斯卡颁奖结果。它在商业分析、市场销售、新闻等领域拥有很高价值,因而苹果以 2亿多美元的价格收购 Topsy。

大数据

大数据

大数据产业链分析

大数据产业链可以分为四个部分: 数据采集和整合、数据存储和运算、数据分析和挖掘、数据应和消费。数据采集和整合是指通过技术手段从互联网、 移动终端、 物联网、 应用软件等采集数据,然后把数据按照一定的规则进行存储和运算,再按照需求调用数据并进行智能分析和挖掘,将数据转化成价值信息或者产品,为决策支持、提升效率、 创新产品提供依据。

大数据

数据资产开始成为核心资源

拥有数据,大数据时代的王者。在大数据时代, 数据资产已经成为核心资源, 2012年,奥巴马政府明确提出 将“大数据战略”上升为国家意志,并将数据定义为“未来的新石油”, 因此,拥有数据可谓是大数据时代的王者。 拥有数据的机构可以分为三类:

一是既有数据、 又有大数据思维的互联网公司,如阿里巴巴、腾讯、京东、 Google、Amazon等,在互联网端积累了大量的数据资源,而且此类公司 IT 起家, 对大数据有天生敏锐的嗅觉, 大数据技术也相对成熟, 因此,互联网公司 可谓是最早使用大数据的机构,成为大数据应用的先行者;

二是传统软件公司转型互联网,通过 SaaS 模式为用户提供服务, 例如用友软件推出畅捷通,以云模式为小微企业提供财务管理应用, 也可以认为是既有数据、 又有大数据思维的模式;

三是拥有数据,缺乏大数据思维的机构,这类机构手里掌握着大量的数据,但是没有能力自己有效利用, 例如金融机构、 运营商、政府部门等。

使用数据,数据变现的推动者。对于手里掌握大量数据,但没有能力变现的机构而言,需要专业的第三方公司提供大数据服务,主要是各类 IT咨询机构和行业应用软件厂商,尤其是行业应用软件厂商, 在各自的领域具有天然的卡位优势: 软件公司提供了行业应用软件和相关的运营维护, 行业应用软件本身就是重要的数据来源,软件公司 属于不拥有数据,但可以接触到数据的机构, 且天然拥有大数据思维和大数据技术,以及良好的行业客户关系,从信息系统建设延伸到大数据运营顺理成章。因此,各个细分行业的应用软件提供商有望成为传统拥有数据机构的重要合作伙伴, 助力其探索大数据价值变现。

大数据技术是重要生产力

大数据应用好坏的关键除了 数据本身,还在于大数据技术, 大数据技术包括数据采集、数据存取、基础架构、数据处理、统计分析、数据挖掘、模型预测、结果呈现等环节,涉及的技术环节极广, 随着数据体量增大和数据复杂性程度提高,大数据技术本身也处于快速迭代的发展过程中。值得一提的是,大数据技术落地的一大重要因素在于如何实现技术与业务的融合, 这背后需要深厚的业务理解, 对于既有数据、 又有大数据思维的互联网公司 来说,技术和业务本身是相互驱动、共同发展的, 对于拥有数据,缺乏大数据思维的机构而言, 在行业深耕多难的应用软件提供商则是最好的选择。

大数据


本文作者:佚名

来源:51CTO

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
10天前
|
数据采集 数据可视化 大数据
Python在大数据处理中的应用实践
Python在大数据处理中扮演重要角色,借助`requests`和`BeautifulSoup`抓取数据,`pandas`进行清洗预处理,面对大规模数据时,`Dask`提供分布式处理能力,而`matplotlib`和`seaborn`则助力数据可视化。通过这些工具,数据工程师和科学家能高效地管理、分析和展示海量数据。
39 4
|
17天前
|
存储 分布式计算 大数据
数据仓库与数据湖在大数据架构中的角色与应用
在大数据时代,数据仓库和数据湖分别以结构化数据管理和原始数据存储见长,共同助力企业数据分析。数据仓库通过ETL处理支持OLAP查询,适用于历史分析、BI报表和预测分析;而数据湖则存储多样化的原始数据,便于数据探索和实验。随着技术发展,湖仓一体成为趋势,融合两者的优点,如Delta Lake和Hudi,实现数据全生命周期管理。企业应根据自身需求选择合适的数据架构,以释放数据潜力。【6月更文挑战第12天】
43 5
|
5天前
|
搜索推荐 安全 大数据
大数据在医疗领域的应用与前景
【6月更文挑战第26天】大数据在医疗领域提升服务效率,助力疾病预防与精准治疗。电子病历优化数据管理,疾病预测预防个性化医疗成为可能。未来,智能医疗系统普及,远程医疗兴起,数据共享促进行业发展,同时隐私保护与安全备受关注。大数据正重塑医疗,开启健康新篇章。
|
13天前
|
监控 数据可视化 大数据
大数据技术在公共交通系统规划中的应用
大数据技术在公共交通系统规划中的应用
|
18天前
|
分布式计算 大数据 数据处理
Apache Spark在大数据处理中的应用
Apache Spark是大数据处理的热门工具,由AMPLab开发并捐赠给Apache软件基金会。它以内存计算和优化的执行引擎著称,提供比Hadoop更快的处理速度,支持批处理、交互式查询、流处理和机器学习。Spark架构包括Driver、Master、Worker Node和Executor,核心组件有RDD、DataFrame、Dataset、Spark SQL、Spark Streaming、MLlib和GraphX。文章通过代码示例展示了Spark在批处理、交互式查询和实时数据处理中的应用,并讨论了其优势(高性能、易用性、通用性和集成性)和挑战。【6月更文挑战第11天】
46 6
|
14天前
|
机器学习/深度学习 自然语言处理 供应链
深度学习在大数据分析中的应用非常广泛
深度学习在大数据分析中的应用非常广泛
|
29天前
|
分布式计算 Spark 大数据
深入探究Apache Spark在大数据处理中的实践应用
【6月更文挑战第2天】Apache Spark是流行的开源大数据处理框架,以其内存计算速度和低延迟脱颖而出。本文涵盖Spark概述、核心组件(包括Spark Core、SQL、Streaming和MLlib)及其在数据预处理、批处理分析、交互式查询、实时处理和机器学习中的应用。通过理解Spark内部机制和实践应用,可提升大数据处理效率,发挥其在各行业的潜力。
|
6天前
|
消息中间件 存储 大数据
深度分析:Apache Kafka及其在大数据处理中的应用
Apache Kafka是高吞吐、低延迟的分布式流处理平台,常用于实时数据流、日志收集和事件驱动架构。与RabbitMQ(吞吐量有限)、Pulsar(多租户支持但生态系统小)和Amazon Kinesis(托管服务,成本高)对比,Kafka在高吞吐和持久化上有优势。适用场景包括实时处理、数据集成、日志收集和消息传递。选型需考虑吞吐延迟、持久化、协议支持等因素,使用时注意资源配置、数据管理、监控及安全性。
|
6天前
|
SQL 运维 druid
深度分析:Apache Doris及其在大数据处理中的应用
Apache Doris是一款开源的高性能实时分析数据库,设计用于低延迟SQL查询和实时数据处理,适合大规模实时分析场景。与Apache Druid、ClickHouse和Greenplum相比,Doris在易用性和实时性上有优势,但其他产品在特定领域如高吞吐、SQL支持或数据处理有特长。选型要考虑查询性能、实时性、SQL需求和运维成本。Doris适用于实时数据分析、BI报表、数据中台和物联网数据处理。使用时注意资源配置、数据模型设计、监控调优和导入策略。
|
6天前
|
消息中间件 分布式计算 Kafka
深度分析:Apache Flink及其在大数据处理中的应用
Apache Flink是低延迟、高吞吐量的流处理框架,以其状态管理和事件时间处理能力脱颖而出。与Apache Spark Streaming相比,Flink在实时性上更强,但Spark生态系统更丰富。Apache Storm在低延迟上有优势,而Kafka Streams适合轻量级流处理。选型考虑延迟、状态管理、生态系统和运维成本。Flink适用于实时数据分析、复杂事件处理等场景,使用时注意资源配置、状态管理和窗口操作的优化。