开源大数据周刊-第15期

简介: 最近大数据的一些论断,如:中国大数据发展10大趋势5大挑战,数据在工业的崛起将重塑整个商业社会,涂子沛:都说收集数据很难,也许是思维错了。

阿里云E-Mapreduce动态

E-Mapreduce团队

1.4版本(已经发布)

  • 作业运行失败报警
  • 作业并行提交
  • 添加sqoop、shell类型的作业

1.4.1版本(正在研发)

  • 完善失败报警
  • 完善定时任务,增加小时、分钟定时任务

1.5.0版本 (正在研发)

  • 集群整体运行情况的仪表盘
  • 集群状态监控报警

1.5.0版本

  • 交互式查询(支持hive、spark)

资讯

中国大数据发展10大趋势5大挑战
中国大数据发展10大趋势5大挑战,如:大数据的首席数据官开始崛起、可视化推动大数据平民化、智能化嵌入、机器学习迎来上扬态势、开源应用加速等10大趋势及相应的挑战。

数据在工业的崛起将重塑整个商业社会,你信吗?
无论是德国的工业4.0,还是美国的工业互联网,或是我国的中国制造2025,都离不开大数据,可以说,大数据在工业的崛起将重塑整个商业社会,其影响力甚至不是互联网所能比的,你信吗?事实上,工业4.0带来的智能生产、智能运维、智能服务、云工场及跨界打击将重构整个商业体系

涂子沛:都说收集数据很难,也许是思维错了
互联网上流行过一个“查水表”的段子:“开门,查水表的”, 就是不开,因为“水表在外面”(看不懂的自行百度,另一个关键词是爆破组)。台词后来又演变为“水表已拆”——有人在说完话之后刻意补上这4个字,然后心照不宣地笑了

国家统计局科学研究所副所长许亦频:大数据思维让政府统计更准确
在居民收入统计当中,大家可能常常说,收入统计低了、高了、或被提高了。在大数据时代,国家统计局找到了一个有效的办法,用居民的纳税记录来反推高收入人群的收入数据。这个方法对于个体分析是不可以的,但是作为国家管理部门取得一个宏观平均数据是可以操作的。我们正在做这个尝试,希...

巧用MapReduce+HDFS,海量数据去重的五种方法
随着存储数据信息量的飞速增长,越来越多的人开始关注存储数据的缩减方法。数据压缩、单实例存储和重复数据删除等都是经常使用的存储数据缩减技术。

Hadoop、Spark、HBase与Redis的适用性讨论
本文跟大家讨论一下Hadoop、Spark、HBase及Redis等几个主流大数据技术的使用场景

基于Hadoop集群的大规模分布式深度学习
在过去的十年里,Yahoo 一直持续投资建设和扩展 Apache Hadoop 集群,到目前为止共有超过 4 万台服务器和 600PB 数据分布在 19 个集群上。

国内大数据相关会议

| 会议 | 地点 | 时间 | 费用 |
| --- | --- | --- | --- |
| 2016上海china Hadoop Summit | 上海 | 2016年07月29日-2016年07月30日 | 收费 |
| Strata + Hadoop World | 北京 | 2016年8月04- 2016年8月06日 | 收费 |
| 2016北京云栖大会 | 北京 | 2016年08月07日 | 免费|

版权声明

信息都是来自互联网,都给出了原文的链接,如果侵权,请联系我们,我们负责删除。
阿里云E-Mapreduce团队 出品

历史周刊链接

开源大数据周刊-第13期
开源大数据周刊-第12期
开源大数据周刊-第11期
开源大数据周刊-第10期
开源大数据周刊-第9期
开源大数据周刊-第8期
开源大数据周刊-第7期
开源大数据周刊-第6期
开源大数据周刊-第5期
开源大数据周刊-第4期
开源大数据周刊-第3期
开源大数据周刊-第2期
开源大数据周刊-第1期

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
存储 SQL 分布式计算
开源大数据比对平台设计与实践—dataCompare
开源大数据比对平台设计与实践—dataCompare
66 0
|
4月前
|
SQL 大数据 关系型数据库
开源大数据比对平台(dataCompare)新版本发布
开源大数据比对平台(dataCompare)新版本发布
69 0
|
4月前
|
SQL 存储 分布式计算
从0到1介绍一下开源大数据比对平台dataCompare
从0到1介绍一下开源大数据比对平台dataCompare
105 0
|
5月前
|
机器学习/深度学习 分布式计算 大数据
开源大数据平台的发展
开源大数据平台的发展
64 0
|
5月前
|
人工智能 分布式计算 大数据
开源大数据平台 3.0 技术解读
阿里云研究员,阿里云计算平台事业部开源大数据平台负责人王峰围绕新一代的流式湖仓、全面 Serverless 化、更智能的开源大数据等多维度解读开源大数据平台 3.0~
1020 1
开源大数据平台 3.0 技术解读
|
1月前
|
SQL 存储 监控
构建端到端的开源现代数据平台
构建端到端的开源现代数据平台
51 4
|
4月前
|
SQL 存储 大数据
从0到1介绍一下开源大数据服务平台dataService
从0到1介绍一下开源大数据服务平台dataService
108 1
|
4月前
|
大数据 Linux KVM
【云计算与大数据技术】虚拟化技术、开源技术Xen、KVM、OpenVZ的讲解(图文解释 超详细)
【云计算与大数据技术】虚拟化技术、开源技术Xen、KVM、OpenVZ的讲解(图文解释 超详细)
97 0
|
4月前
|
存储 人工智能 大数据
2023云栖陈守元,阿里云开源大数据产品年度发布
阿里云计算平台事业部开源大数据产品总监陈守元围绕EMR、Flink Streaming Lakehouse、 Elasticsearch、Milvus等产品发布展开分享介绍。
261 2
|
6月前
|
存储 分布式计算 数据可视化
开源在大数据和分析中的角色
开源在大数据和分析中的角色
49 0