分布式计算

首页 标签 分布式计算
# 分布式计算 #
关注
37780内容
Hadoop Namenode不能启动 dfs/name is in an inconsistent
<div style="font-family:'lucida Grande',Verdana,'Microsoft YaHei'; font-size:14px; line-height:23.8px"> <h1 style="font-size:22px; font-weight:normal; margin:0px 0px 10px; padding:0px; font-famil
阿里巴巴飞天大数据架构体系与Hadoop生态系统
先说Hadoop 什么是Hadoop? Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统,主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算,充分利用集群的威力进行高速运算和存储。
专访HDFS committer Intel 研发经理郑锴:EC之后,HDFS下一步新思考
在作为HDFS诞生以来的最大改进——支持了纠删码(erasure coding)之后,面对这个比较完善但并不十全十美的方案,面对Hadoop开源生态,HDFS的下一步将走向何处呢?
比起表白这件事,玩大数据会更容易吗?
有人认为爱是性,是婚姻,是清晨六点的吻,是一堆孩子,也许真是这样的,莱斯特小姐。但你知道我怎么想吗,我觉得爱是想触碰又收回手。 ——塞林格 《破碎故事之心》
PyODPS 中使用 Python UDF
PyODPS 中使用 Python UDF 包含两方面,一个是直接使用,也就是在 MaxCompute SQL 中使用;一个是间接的方式,也就是 PyODPS DataFrame,这种方式你不需要直接写 Python UDF,而是写普通的 Python 函数或者类。
免费试用