大数据开篇

简介:
。大数据时代来临的因素:
1.1信息浪潮
    1.第一次  1980  PC机  解决问题:信息处理   代表企业 :Intel AMD IBM
    2.第二次   1995  互联网   解决问题:信息传输  代表企业:雅虎,谷歌  BAT
    3.第三次   2010  物联网、云计算、大数据  解决问题:信息爆炸  代表企业 亚马逊、谷歌、Cloudera、阿里云等
1.2信科技为大数据时代提供技术支撑
    1.存储设备容量增加(DVD光盘为例。将来可以 1DVD容量 10^6GB
    2.CPU处理能力提升
    3.网络带宽增加
1.3数据产生方式的变革促成大数据时代的来临(数据产生阶段)
    1.运营式系统阶段
    2.用户原创内容阶段
    3.感知系统阶段
1.4大数据发展历程
    1.萌芽期 20世纪90年代 -21世纪初    数据库技术成熟和数据挖掘理论
    2.成熟期 21世纪前10年  web2.0应用发展,非结构化数据大量产生,Hadoop平台MapReduce技术
    3.大规模应用  2010年后  数据驱动决策,信息社会智能化程度
2 大数据的概念
    4V  Volume 数据量大  Variety 数据类型繁多 Velocity 处理速度快 Value 价值密度低
    2.1 数据量大
    1ZB=1024EB 1024PB 1024TB 1024GB 1024MB 1024KB 1024Byte 8bit
    大数据以每年50%的速度在增长,也就是说每两年就增加一倍,这被称为“大数据摩尔定律”
    2.2 数据类型繁多
        10%存储在关系型数据库中,90%存储在非关系型数据库中
    2.3 处理速度快
    2.4 价值密度低
3 大数据的影响
    人类科学研究经历四种模式:
        1.实验科学
        2.理论科学
        3.计算科学
        4.数据密集型科学
    思维的转变:
     1.全面而非抽样
     2.效率而非精确
     3.相关而非因果
大数据计算模式
    1.批处理计算
    2.流计算
    3.图计算
    4.查询分析计算
大数据与云计算和物联网
    大数据:    4V  Volume 数据量大  Variety 数据类型繁多 Velocity 处理速度快 Value 价值密度低
    云计算:通过网络提供课伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT
        资源。
    云计算包括3种典型的服务模式。LaaS PaaS SaaS 基础设施即服务 平台即服务 软件即服务
    1.云计算关键技术:
        虚拟化、分布式存储、分布式计算、多租户等。
    2.云计算数据中心 (地质稳定,凉爽舒适)
        计算中心电力利用:(55%电力用于制冷 45%服务器(其中70%服务器风扇,30%CPU(其中10%用于计算)))
    物联网:物物相连的物联网,是互联网的延伸,利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过
        新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。
        技术角度分四个层面:感知层、网络层、处理层和应用层。
区别:大数据侧重于对海量数据的存储、处理与分析,从海量数据中发现价值,服务与生产和生活。
    云计算本质旨在整合和优化各种IT资源,通过网络以服务的方式廉价地提供给用户
    物联网发展目标物物相联,应用创新时物联网的核心。
联系:云计算为大数据提供了技术基础。云计算为物联网提供海量数据存储能力。
      大数据为云计算提供用武之地。大数据为物联网数据分析提供支撑。
      物联网为云计算技术提供了广阔的应用空间。物联网是大数据的重要来源。









本文转自 swallow_zys  51CTO博客,原文链接:http://blog.51cto.com/12042068/1928031,如需转载请自行联系原作者
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
前端开发 Android开发
使用Android Studio(AS)查看apk信息
使用Android Studio(AS)查看apk信息
1273 0
使用Android Studio(AS)查看apk信息
|
JSON JavaScript 小程序
关于HBuilderX的简单介绍
关于HBuilderX的简单介绍
4121 0
|
关系型数据库 数据处理 对象存储
实时计算 Flink版产品使用问题之定时器执行存在延迟好几个小时,该如何处理
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
安全 开发者
LabVIEW程序退出后线程仍在运行问题
LabVIEW程序退出后线程仍在运行问题
394 2
|
存储 移动开发 C#
一篇文章讲明白MIME详解
一篇文章讲明白MIME详解
792 0
|
开发工具 开发者 git
使用git和github进行协同开发流程
目录 前言 仓库(Repository) 源仓库 开发者仓库 分支(Branch) 永久性分支 暂时性分支 工作流(workflow) 总结 参考资料 前言 (本文假设各位已经对基本git的基本概念、操作有一定的理解,如无相关git知识,可以参考Pro Git这本书进行相关的学习和练习) 很多项目开发都会采用git这一优秀的分布式版本管理工具进行项目版本管理,使用github开源平台作为代码仓库托管平台。
2637 0
|
关系型数据库 Shell Nacos
【SpringCloud-Alibaba系列教程】16.动态配置yml以及分布式事务
动态配置yml、分布式事务以及使用seata。
1336 1
【SpringCloud-Alibaba系列教程】16.动态配置yml以及分布式事务
|
网络协议 Linux 网络安全
Iptables详解-快速从理论到实践
Netfilter是由Rusty Russell提出的Linux 2.4内核防火墙框架,该框架既简洁又灵活, 可实现安全策略应用中的许多功能,如数据包过滤、数据包处理、地址伪装、透明代理、动态网络地址转换(Network Address Translation,NAT),以及基于用户及媒体访问控制(Media Access Control,MAC)地址的过滤和基于状态的过滤、包速率限制等。
736 0
Iptables详解-快速从理论到实践
|
Ubuntu 安全 网络协议
Ubuntu SSH连接、远程上传下载文件
Ubuntu SSH连接、远程上传下载文件
1620 0
|
弹性计算 运维 监控
一文读懂云上DevOps能力体系!
自动化运维等级金字塔、自动化运维的进阶模式、DevOps的基础核心、云上标准化部署三大能力......
一文读懂云上DevOps能力体系!

热门文章

最新文章