文档备案控制台

开发者社区问答正文

hadoop的序列化的特点及功能是什么？

hadoop的序列化的特点及功能是什么？

展开

收起

游客daliwbfb2wo66 2021-12-05 13:13:03 709 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客k7rjnht6hbtk6

1、节省资源：由于带宽和存储是集群中的最宝贵的资源所以我们必须想法设法缩小传递信息的大小和存储大小，hadoop的序列化就为了更好地坐到这一点而设计的。

2、对象可重用：JDK的反序列化会不断地创建对象，这肯定会造成一定的系统开销，但是在hadoop的反序列化中，能重复的利用一个对象的readField方法来重新产生不同的对象。

3、可扩展性：当前hadoop的序列化有多中选择可以利用实现hadoop的WritableComparable接口。也可使用开源的序列化框架protocol Buffers，Avro等框架。我们可以注意到的是hadoop2.X之后是实现一个YARN，所有应用（mapreduce，或者其他spark实时或者离线的计算框架都可以运行在YARN上），YARN还负责对资源的调度等等。YARN的序列化就是用Google开发的序列化框架protocol Buffers，proto目前支持支持三种语言C++，java，Python所以RPC这一层我们就可以利用其他语言来做文章，满足其他语言开发者的需求。

2021-12-05 13:13:27

赞同展开评论

问答分类：

分布式计算 Hadoop

问答标签：

hadoop序列化序列化hadoop

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Hadoop反序列化是什么？

267

1

0

Hadoop序列化是什么？

341

1

0

Hadoop序列化和反序列化的作用分别是什么呢？

700

1

0

hadoop使用自己的序列化格式为什么？

483

1

0

在hadoop分布式计算框架中如何对全排序进行序列化？

467

1

0

Hadoop中的序列化框架Google Protocolbuffer的缺点是什么？

421

1

0

Hadoop中的序列化框架Google Protocolbuffer的优点是什么？

441

1

0

Hadoop中的序列化框架Google Protocolbuffer是什么？

309

1

0

Hadoop中的序列化框架Facebook Thrift的作用是什么？

402

1

0

Hadoop中的序列化框架Apache Avro的作用是什么？

513

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

notebook启动安全验证一直失败

vllm部署模型，参数如何指定

怎么在cursor上使用mcp来采集网页数据，听说brightdata-mcp适合做爬虫，好用吗？

请教一下，我4张a6000可以部署什么好点的模型

宜搭如何将流程表单的子表单中选择的人员，加入审批流程？

相关文章

21,000张SIM卡背后的“短信工厂”：印度CBI突袭国家级钓鱼基础设施

MaxCompute SQL AI 实操：业务员外呼备注有效性判断

MaxCompute SQL AI 实操

从工单、文档到结构化知识库：一套可复用的 Agent 知识采集方案

AMD服务器上一个诡异的性能问题诊断历程

还有其他疑问?