备案控制台

开发者社区问答正文

如果文件被拆分成固定大小的数据块，那这些数据块是怎么保证顺序的，以及数据库块的大小是固定的吗？

如果文件被拆分成固定大小的数据块，那这些数据块是怎么保证顺序的，以及数据库块的大小是固定的吗会不会出现大量的内存碎片，读取的时候是不是要占用大量内存进行合并数据库？

展开

收起

OSC开源社区 2024-05-11 17:36:20 102 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

OSC小助手

比如想读 1GB 的文件，在存储中是 sequantial read。如果全部读出来返回给请求端，更占内存，调用端的等待时间更长。都是 4K/64K/256K/1M 等容量去顺序读，以一个 streaming 的方式持续返回给调用端。所以 JuiceFS 把文件分成 block 存储不会影响性能。相反，还能提升性能。因为更容易通过并发方式同时读很多的 block 返回给调用端，当然获得高吞吐的同时，需要用一点内存资源来换文件被分成很多 data block 存在对象存储中，每个 block key 会存在 meta engine 里（直接存太占空间了，设计上 16 个 block 为一个 chunk，存储 chunkid + offset）。block size 默认设为 4MiB 是最大值，实际会有小于该值的 block。碎片合并有的。读取的时候不用担心，各种存储系统在读的时候也都是按某个大小的 page/block 去读

2024-05-11 19:42:04

赞同 3 展开评论

问答分类：

数据库

问答标签：

文件数据库数据库文件拆分数据库

问答地址：

开发者社区 > 数据库 > 问答

相关问答

如何从单机数据库迁移到PolarDB-X分布式数据库，并实现大表的拆分？

137

1

0

云数据库polardb事务拆分什么原理

102

1

0

数据库垂直拆分和水平拆分是在DRDS里面吗？应该如何操作？

377

1

0

数据库垂直拆分和水平拆分是什么意思？有什么区别？

655

3

0

图数据库中存储文件包含什么？服务器模式运行在集群中跑会发生什么？

1637

1

0

storm&spark2中若df中加载的不是数据库而是其他文件要怎么处理呀？

1298

1

0

DMS数据库导出任务完成后，下载导出文件报错

1167

1

0

有没有遇到同步MySQL一直卡在某个binlog文件？数据库已经确认后续的binlog都生成了 io

893

0

0

我需要下载文件的数据格式和数据库里面的数据格式保持一致。请问这种情况应该怎么处理？

2337

1

0

为什么binlog开启在ttl范围内数据库里信息没更新，binlog文件没了，cdc运行时会报这个错

467

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

上传文件时提示“Illegal file path”，怎么解决的？

阿里云ESA是什么？边缘安全加速和CDN有什么区别？

阿里云短信收费标准，短信群发平台是怎么收费的？

通义灵码使用代理报错

idea通义灵码插件，更新后怎么一直用英文回答。开始对话时，告诉它之后的问题使用中文回答也不行

相关文章

多源 RAG 自动化处理：从 0 到 1 构建事件驱动的实时 RAG 应用

科技云报到：AI落地卡壳数据层？数据库重构价值链路

阿里云8核16g服务器能容纳多少人？性能配置够用吗？

阿里云2核2G服务器够用吗？能支持多少人在线访问？

别用"战术勤奋"掩盖"战略懒惰"：AI时代的降维竞品分析

还有其他疑问?