大数据

首页 标签 大数据
# 大数据 #
关注
48858内容
大数据分布式架构单点故障详解(Hdfs+Yarn+HBase+Spark+Storm)构建HA高可用架构
本文梳理了常见的hadoop生态圈中的组件:Hdfs+Yarn+HBase+Spark+Storm的单点故障问题,出现原因以及单点故障的原理和解决方案(构建HA(High Available)高可用架构)。阅读本文之前,最好了解清楚各组件的架构原理。
【深度学习之美】全面连接困何处,卷积网络见解深(入门系列之九)
低级动物的眼睛多长在两侧,这样视野广阔,便于避险。而人类的双眼只长在一面,视野有死角,安全难保障,可为什么只有人类“高级”起来,进化成为这个地球的主宰呢?进一步地,是广而肤浅好呢,还是深而专注佳呢?再进一步,这和卷积神经网络又有啥关系?进来瞅瞅呗,历史会告诉你答案。
阿里云MaxCompute(大数据)公开数据集---带你玩转人工智能
目前阿里云大数据产品已经免费向全部用户开放了多种公用数据集。开放的数据类别包括:股票价格数据,房产信息,影视及其票房数据。
用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)
尽管数据科学家经常通过分布式云计算来处理数据,但是即使在一般的笔记本电脑上,只要给出足够的内存,Spark也可以工作正常(在这篇文章中,我使用2016年MacBook Pro / 16GB内存,分配给Spark 8GB内存)。
【资料合集】2017云栖大会 成都峰会全面回顾:PDF下载+现场视频
2017云栖大会 成都峰会全方位展示最新云上产品,以全新视角解读大数据时代下的新营销。云栖社区特将本次峰会的讲义PDF+活动视频整理出来,以供大家学习参考。
吴刚专访--大数据和 MaxCompute 技术和故事
2019大数据技术公开课第一季《技术人生专访》来袭,本季将带领开发者们探讨大数据技术,分享不同国家的工作体验。本文整理自阿里巴巴计算平台事业部高级技术专家吴刚的专访,将为大家介绍Apache ORC开源项目、主流的开源列存格式ORC和Parquet的区别以及MaxCompute选择ORC的原因。
阿里云 MaxCompute 2020-11 月刊
2020年11月MaxCompute发布支持以RAM角色身份访问使用服务以及支持消息队列Kafka版通过Connector持续导入数据新功能,详情请查看本月刊内容。
阿里云入选 Gartner 2017年全球云基础设施即服务魔力象限
2017年6月30日,中国杭州 – 阿里巴巴旗下云计算平台阿里云,成功入选全球知名分析机构 Gartner Research 发布的最新《2017年全球云基础设施即服务魔力象限》(由 Gartner 分析师 Lydia Leong 等撰写,报告发布于2017年6月)。
免费试用