大数据

首页 标签 大数据
# 大数据 #
关注
51112内容
菜鸟的Hadoop快速入门
一、相关概念 1、大数据 大数据是一门概念,也是一门技术,是以Hadoop为代表的大数据平台框架上进行各种数据分析的技术。 大数据包括了以Hadoop和Spark为代表的基础大数据框架,还包括实时数据处理,离线数据处理,数据分析,数据挖掘和用机器算法进行预测分析等技术。
阿里云大学精品课程:深入理解阿里云数加大数据开发套件Data IDE-基本知识
基于阿里云数加·MaxCompute构建大数据仓库的开发工具利器Data IDE《MaxCompute(原ODPS)开发入门指南——数据开发工具篇》,那么基于Data IDE进行数据开发想必也遇到一些不少的困惑,就自己在培训过程中的一些经验或者说阿里集团内的踩坑之路与大家在此分享,也欢迎拍砖。
PostgreSQL生态、原理、应用案例、开发与管理实践 - 南京站 (最全资料下载,PPT+回顾视频)
活动介绍 PostgreSQL发展非常的迅猛,覆盖OLTP,OLAP,NoSQL,搜索,时空,流,图,图像等应用场景,往企业级全栈数据库的方向发展。PostgreSQL的应用场景丰富,在稳定性、性能、可用性、可靠性、容灾、安全性、扩展性等方面不亚于商用数据库Oracle,常被业界称为“开源界的Oracle”。
谈谈大数据存储与备份的核心——技术与创新
根据IDC研究报告未来10年全球数据量将以40%多的增长速度呈直线上升趋势2020年全球的数据量将达到35ZB35,000,000PB是2010年的40倍。换句通俗的话说也就是每过1分钟全世界就有1820TB的新数据产生。
2016美国QCon看法:在Beam上,我为什么说Google有统一流式计算的野心
Google在开源社区和云计算上是有很深的痛感的,这种痛感也在促使Google做更多的转变,比如拥抱社区推出更多开源产品,在云计算产品形态上也屈身向3A靠拢,本文中介绍的流式计算产品Beam就是拥抱社区的一个动作,希望能成为一个杰作。
阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点
笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapReduce Job 做 ETL ,用 Hive 做 Ad hocquery,用 Tableau 做数据可视化,用 R 做数据分析)。
PyOdps 0.4版本发布,从一个故事说起
PyOdps 0.4版本,DataFrame API支持使用pandas进行本地计算,用户因此能join ODPS和本地数据,也能进行本地debug,另外还有MapReduce API等新特性
免费试用