文档备案控制台

开发者社区问答正文

阿里在File Metadata中保存了共享存储文件相关的信息，它的结构是怎样的？

阿里在File Metadata中保存了共享存储文件相关的信息，它的结构是怎样的？

展开

收起

罗鹏大佬 2022-04-21 11:00:52 11038 版权

来自：阿里技术

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

11 条回答

写回答

取消提交回答

岩茶芋泥

Hash bucket：是为了在扩缩容的时候搬迁数据的时候，能够按照bucket来扫描，查询的时候，也是一个bucket跟着一个bucket；

Level：是merge tree的层次，0层代表实时写入的数据，这部分数据在合并的时候有更高的权重；

Physical file id：是文件对应的id，64字节是因为它不再与segment关联，不再只需要保证segment内table的唯一性，需要全局唯一；

Stripe id：是因为一个oss文件可以包含多个bucket 的文件，以stripe为单位，方便在segment一次写入的多个bucket合并到一个oss文件中。避免oss小文件，导致性能下降，和oss小文件爆炸；

Total count：是文件行数，这也是后台合并的一个权重，越大合并的权重越低。

Visibility bitmap记录了被删除的文件信息

Start_row对应32k对应一个delete bitmap。这个32000 4k，行存使用的32k的page可以保存7条记录。

Delete count是被删除的数量。

我们无需访问oss，可以直接得到需要merge的文件，避免访问oss带来的延迟，另外oss对于访问的吞吐也有限额，避免频繁访问导致触发oss的限流。

2022-04-21 15:55:34

赞同展开评论
我是快乐的嘟嘟

coder

1

2022-04-21 15:04:39

赞同展开评论
大树营养快线

1

2022-04-21 15:00:46

赞同展开评论
sunyalei

1

2022-04-21 14:57:18

赞同展开评论
那年春天

1

2022-04-21 14:57:18

赞同展开评论
luanpanfei

1

2022-04-21 14:54:58

赞同展开评论
limingxian

1

2022-04-21 14:54:58

赞同展开评论
john散漫

虽然过去不能改变，未来可以！！！

1

2022-04-21 14:54:58

赞同展开评论
dufadayang

无所不能的蛋蛋

1

2022-04-21 14:54:58

赞同展开评论
dingtalk_pbspgm

1

2022-04-21 14:46:14

赞同展开评论
CamilleKing

1

2022-04-21 14:45:13

赞同展开评论

滑动查看更多

问答分类：

存储

问答地址：

开发者社区 > 阿里技术 > 问答

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136649

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11207

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268487

11

0

#支付宝授权提示请在支付宝客户端打开链接

18870

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87393

49

0

this xml file does not appear to have any style in

55025

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35698

17

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

3183

18

0

轻量级应用服务器端口问题（打不开）

32358

21

0

LoRa的网络覆盖能力范围是怎么样的？

4283

1

0

收录在圈子:

阿里技术

7055

+ 订阅

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

ossftp结合FileZilla在公网使用

余数周期闭合与格点守恒计算框架 ——一种离散数值系统的结构化分析方法（陈恩华）

2026阿里云优惠活动政策解读：个人、企业及学生全覆盖，云服务器、AI大模型tokens及免费试用指南

监控局域网电脑屏幕的哈希表优化PHP语言算法

阿里云服务器通用算力型u1、u2i、u2a有何区别？实例性能、适用场景及选购指南参考

相关解决方案

更多

高可用及共享存储 Web 服务

SelectDB实现日志高效存储与实时分析

多模态数据信息提取

高效存储和处理多媒体数据

一键训练模型及部署GPU共享推理服务

还有其他疑问?