前言
本文只介绍应用层代码的编写,不会深入开展讲解计算机底层宏大的架构。
初始dpdk环境以及相关资源
代码:
编译:
运行结果(成功):
判断以太网设备数量
如果数量为0,说明前期的配置工作可能存在错误,停止工作并检查。
获取网卡信息
值得注意的是gDpdkPortId在rte系列函数中,用于代表网卡设备。这些设备在linux操作系统中可能是eth0,eth1……,在rte系列函数中则对应0、1、2、3……
配置网卡接收队列与发送队列数量
之前配置虚拟机vmx配置文件的时候,令ethernet0.virtualDev = “vmxnet3”,vmxnet3就是在模拟多队列网卡。
首先设置一个全局rte_eth_conf结构体变量:
.rxmode意思是设置结构体变量port_conf_default里的rxmode的属性。
.rxmode属性的.max_rx_pkt_len属性设置为一个定值,这个定值一般是1518。其中以太网头和CRC(循环冗余校验)一般会固定占去14个字节和4个字节。
这个结构体这么设置是为了限制接收队列的最大可接收包的长度。
在main函数里继续写上以上代码,意思是设置网卡的接收队列数量和发送队列数量,以及相关的端口参数。每个接收队列和发送队列都有自己的缓冲区和处理逻辑。(rx:receive,tx:transmit)。接收队列和发送队列的数量不可超过网卡可设置的最大队列数量。
创建内存池
这里的内存池也叫mbuf池,负责储存接收到的数据包,这里存储的是原始数据。Mbuf内存和skbuff相似点很多,但是前者一般用在dpdk这类高性能框架,后者一般用在内核协议栈,所以还是会有区别的。
第一个参数用于给内存池起名。
第二个参数用于设置内存块数量。
第三个参数代表每个内存块的本地缓存大小,意思把缓存指定为内存块的一部分。
第四个参数代表每个内存块的私有数据大小,如果mbuf有自定义数据则需要设置。
第五个参数代表了每个内存块的数据缓冲区大小。
第六个参数是一个NUMA节点的套接字标识符,NUMA是一种计算机体系的结构,每个NUMA节点都会有自己对应的内存和处理器资源。rte_socket_id()用于获取当前执行线程所在的NUMA节点套接字标识符。
用内存池配置rx队列
Rx队列也就是接收队列。
第一个参数是网卡标识。
第二个参数是接收队列标识,填了0表示是第一个队列。
第三个参数是设置接收队列中接收描述符的数量,可以通过接收描述符进入对应的数据缓冲区。
第四个参数是一个NUMA节点的套接字标识符。rte_eth_dev_socket_id(gDpdkPortId)用于获取指定的网络设备所在的NUMA节点的套接字标识符。
第五个参数是一个rte_eth_rxconf指针,可以通过这个指针设置接收队列的属性。
第六个参数是接收队列对应的内存池地址。mbuf池需要事先创建。
获取并解析udp数据包
- 建立一个while循环,用于循环查询是否接收到数据包,之后再循环体内部写代码。
- 建立一个mbuf指针数组,用于存储数据包存储的内存块的地址。
- 用rte_eth_rx_burst函数接收多个原始的数据包,并且存入了mbuf中,将mbuf的地址存入mbufs指针数组。如果数据包的数量过多超过了限制,那么报错。
- 遍历mbufs指针数组。
- 用rte_pktmbuf_mtod函数获取mbuf的地址,并且转为struct rte_ether_head *格式。先对RTE_ETHER_TYPE_IPV4进行大端字节序转换,如果ehter_type不是该值,说明接收到的包包头不是IPv4协议类型。不再继续。
- 对mbuf内存块进行指针偏移,要求完美避开以太网头的部分,把后续部分转为IP头。如果发现不是UDP协议,那么也终止操作。否则进一步解析,把payload部分取出尝试报文发送
尝试发送报文
在windows上操作。需要在eth0的统一网段下添加是eth0的IP为静态IP。
未完……