零拷贝技术(DMA、MMAP、sendfile)

简介: 零拷贝技术(DMA、MMAP、sendfile)

零拷贝mmap、sendfile

定义

零拷贝技术主要是解决传统网络I/O操作中发送文件的性能问题:如下图表示一次read和write时传统I/O涉及到的CPU操作:

  • 涉及到4次用户态↔内核态上下文切换,其中read切换两次、write切换两次;
  • 涉及到4次数据拷贝。其中DMA拷贝两次、CPU拷贝两次;

上述操作多次的上下文切换与拷贝会影响性能。

可以使用零拷贝技术mmap+writesendfilesplice来优化。

DMA

DMA(Direct Memory Access),即直接存储器存取,是一种快速传送数据的机制。利用它进行数据传送时不需要CPU的参与

使用DMA拷贝数据会获取一部分系统数据总线资源,用来传输数据,而不需要CPU参数。IO读取也不会引发中断。CPU读取IO操作,系统调用时是会引发中断的。

mmap

mmap(memory map)采用虚拟内存,地址映射来减少一次拷贝。可以减少将数据从内核态拷贝到用户态的性能消耗。

如上图所示,从数据并没有从内核态拷贝到用户态,而是直接通过内存映射的方式得到待传文件的虚拟内存地址,在发送的时候,可以通过共享的虚拟内存地址将待发送文件信息拷贝到socket缓存区,发送出去。

#include <sys/mman.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <unistd.h>
#include <fcntl.h>
#include <cstring>
int main() {
    // 打开文件并将其映射到内存中
    int fd = open("file.txt", O_RDONLY);
    size_t size = lseek(fd, 0, SEEK_END);
    char* data = (char*) mmap(nullptr, size, PROT_READ, MAP_PRIVATE, fd, 0);
    // 创建套接字并连接到目标地址
    int sock = socket(AF_INET, SOCK_STREAM, 0);
    sockaddr_in addr;
    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = inet_addr("127.0.0.1");
    addr.sin_port = htons(1234);
    connect(sock, (sockaddr*) &addr, sizeof(addr));
    // 将内存中的数据直接写入套接字
    write(sock, data, size);//
    // 关闭套接字和文件,并解除内存映射
    close(sock);
    munmap(data, size);
    close(fd);
    return 0;
}

mmap这里只是减少了copy,但还是需要4次上下文切换。那是否有什么方式可以减少上下文切换,这时sendfile就出来了。

sendfile

sendfile可以减少文件发送时的上下文切换。

从 Linux 2.1 版本开始,Linux 引入了 sendfile来简化操作。sendfile方式可以替换上面的mmap/write方式来进一步优化。

sendfile将以下操作:

mmap();
  write();

替换为:

sendfile();

这样就减少了上下文切换,因为少了一个应用程序发起write操作,直接发起sendfile操作。

直接通过DMA将磁盘数据复制到缓存区,在内核态将缓冲区的数据拷贝到socket缓存区,不需要用户态参与。

#include <sys/socket.h>
#include <fcntl.h>
#include <cstring>
int main() {
    // 打开文件并获取文件描述符
    int fd = open("file.txt", O_RDONLY);
    // 创建套接字并连接到目标地址
    int sock = socket(AF_INET, SOCK_STREAM, 0);
    sockaddr_in addr;
    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = inet_addr("127.0.0.1");
    addr.sin_port = htons(1234);
    connect(sock, (sockaddr*) &addr, sizeof(addr));
    // 使用sendfile函数将文件信息发送到套接字
    off_t offset = 0;
    struct stat stat_buf;
    fstat(fd, &stat_buf);
    sendfile(sock, fd, &offset, stat_buf.st_size);//直接使用sendfile发送文件,避免上下文切换
    // 关闭套接字和文件
    close(sock);
    close(fd);
    return 0;
}

可以看到sendfile经历了3次的copy动作,而且没有频繁的用户态↔内核态的状态切换。

那sendfile是不是就是完美的,还可不可以把cpu copy也节省呢?

带有 scatter/gather 的 sendfile方式

Linux 2.4 内核进行了优化,提供了带有 scatter/gather 的 sendfile 操作,这个操作可以把最后一次 CPU COPY 去除。其原理就是在内核空间 Read BUffer 和 Socket Buffer 不做数据复制,而是将 Read Buffer 的内存地址、偏移量记录到相应的 Socket Buffer 中,这样就不需要复制。其本质和虚拟内存的解决方法思路一致,就是内存地址的记录。

下图展示了scatter/gather 的 sendfile 的原理:

splice

sendfile不同的是,splice允许任意两个文件互相连接,而并不只是文件与socket进行数据传输。

对于从一个文件描述符发送数据到socket这种特例来说,一直都是使用sendfile系统调用;

splice一直以来就只是一种机制,它并不仅限于sendfile的功能。也就是说 sendfile 是 splice 的一个子集。

和 sendfile 不同的是,splice 不需要硬件支持。


目录
相关文章
|
Linux C语言
Linux 零拷贝sendfile函数
sendfile函数允许在两个文件描述符之间直接传输数据,而无需将数据从内核空间复制到用户空间再发送。它在 Linux 系统上首次出现于 2.2 内核版本。效率很高,这被称为零拷贝。out_fd是输出文件描述符,通常是网络套接字描述符。in_fd是输入文件描述符,通常是打开的文件或套接字。offset是一个指向 off_t 类型的指针,用于指定从输入文件的哪个位置开始传输数据。如果为NULL,则从当前文件偏移量开始传输。count是要传输的字节数。
359 0
|
4月前
|
存储 Java Linux
详细地说一说零拷贝
我是小假 期待与你的下一次相遇 ~
214 1
详细地说一说零拷贝
|
Linux 数据处理 C++
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用(一)
Linux系统编程 C/C++ 以及Qt 中的零拷贝技术: 从底层原理到高级应用
580 0
|
6月前
|
消息中间件 存储 设计模式
RocketMQ原理—5.高可用+高并发+高性能架构
本文主要从高可用架构、高并发架构、高性能架构三个方面来介绍RocketMQ的原理。
1555 21
RocketMQ原理—5.高可用+高并发+高性能架构
|
12月前
|
消息中间件 存储 缓存
美团面试: Kafka为啥能实现 10Wtps 到100Wtps ?kafka 如何实现零复制 Zero-copy?
40岁老架构师尼恩分享了Kafka如何实现高性能的秘诀,包括零拷贝技术和顺序写。Kafka采用mmap和sendfile两种零拷贝技术,前者用于读写索引文件,后者用于向消费者发送消息,减少数据在用户空间和内核空间间的拷贝次数,提高数据传输效率。此外,Kafka通过顺序写日志文件,避免了磁盘寻道和旋转延迟,进一步提升了写入性能。尼恩还提供了系列技术文章和PDF资料,帮助读者深入理解这些技术,提升面试竞争力。
美团面试: Kafka为啥能实现 10Wtps 到100Wtps ?kafka 如何实现零复制 Zero-copy?
|
12月前
|
消息中间件 Java Linux
得物面试:什么是零复制?说说 零复制 底层原理?(吊打面试官)
尼恩,40岁老架构师,专注于技术分享与面试辅导。近期,尼恩的读者群中有小伙伴在面试一线互联网企业如得物、阿里、滴滴等时,遇到了关于零复制技术的重要问题。为此,尼恩系统化地整理了零复制的底层原理,包括RocketMQ和Kafka的零复制实现,以及DMA、mmap、sendfile等技术的应用。尼恩还计划推出一系列文章,深入探讨Netty、Kafka、RocketMQ等框架的零复制技术,帮助大家在面试中脱颖而出,顺利拿到高薪Offer。此外,尼恩还提供了《尼恩Java面试宝典》PDF等资源,助力大家提升技术水平。更多内容请关注尼恩的公众号【技术自由圈】。
得物面试:什么是零复制?说说 零复制 底层原理?(吊打面试官)
|
11月前
|
消息中间件 缓存 Java
java nio,netty,kafka 中经常提到“零拷贝”到底是什么?
零拷贝技术 Zero-Copy 是指计算机执行操作时,可以直接从源(如文件或网络套接字)将数据传输到目标缓冲区, 而不需要 CPU 先将数据从某处内存复制到另一个特定区域,从而减少上下文切换以及 CPU 的拷贝时间。
java nio,netty,kafka 中经常提到“零拷贝”到底是什么?
|
消息中间件 调度 RocketMQ
【RocketMQ系列六】RocketMQ事务消息
【RocketMQ系列六】RocketMQ事务消息
2745 1
|
12月前
|
Java 大数据 Linux
《揭秘高性能 I/O 利器:mmap 内存映射与 sendfile 技术》
本文详细解析了mmap内存映射和sendfile技术,探讨了它们的工作原理、优势及应用场景,帮助读者理解如何通过这些技术提升数据传输效率,并提供了实际代码示例,为技术选型提供参考。关键词:mmap、sendfile、高性能I/O、零拷贝。
311 0
|
消息中间件 存储 RocketMQ
2分钟看懂RocketMQ延迟消息核心原理
本文从源码层面解析了RocketMQ延迟消息的实现原理,包括延迟消息的使用、Broker端处理机制以及定时任务对延迟消息的处理流程。
2分钟看懂RocketMQ延迟消息核心原理