rbpf虚拟机-验证器(verifier)

简介: 该篇文章是rbpf虚拟机验证器代码块功能的整理。(学习该虚拟机的目的是为了搞懂solana合约的执行方式,solana使用的rbpf是在该虚拟机上进行扩展。)

Welcome to Code Block's blog

本篇文章主要介绍了
[rbpf虚拟机-验证器(verifier)]
❤博主广交技术好友,喜欢我的文章的可以关注一下❤

一、概述

该篇文章是rbpf虚拟机验证器代码块功能的整理。

(学习该虚拟机的目的是为了搞懂solana合约的执行方式,solana使用的rbpf是在该虚拟机上进行扩展。)

这个 eBPF 验证器是在 eBPF 程序加载到虚拟机(VM)时执行的简单检查工具,与 Linux 内核中更复杂的验证器不同。它不涉及程序流控制(应为有向无环图)或寄存器使用一致性等深入检查。

什么是rbpf虚拟机?

RBPF虚拟机是一种基于Rust语言开发的轻量级虚拟机,用于执行BPF(Berkeley Packet Filter)程序。BPF是一种在内核中执行过滤和转发网络数据包的技术,RBPF虚拟机可以用来模拟和执行这些BPF程序,以实现网络数据包的快速过滤和处理。RBPF虚拟机通过提供一个安全的执行环境,可以在用户空间中运行BPF程序,而无需直接访问内核,从而提高了安全性和性能。RBPF虚拟机还支持在不同的操作系统和平台上运行,是一个功能强大的工具,被广泛应用于网络安全、性能优化等领域。


二、主要功能

验证器主要执行以下检查:

  1. 程序长度检查

    • 指令必须是 8 字节的倍数
    • 最大指令数限制为 1,000,000 字节
    • 程序不能为空
    • 程序必须以 "EXIT" 指令结束
  2. 指令格式检查

    • 检查 LD_DW(64位加载)指令是否完整(由两条连续指令组成)
    • 检查跳转指令的目标是否有效
    • 检查寄存器访问是否合法
  3. 操作码验证

    • 验证所有操作码是否属于已知类型

三、关键函数解析

check_prog_len - 程序长度检查

fn check_prog_len(prog: &[u8]) -> Result<(), Error> {
     
    // 检查是否为8字节倍数
    if prog.len() % ebpf::INSN_SIZE != 0 {
     
        reject(...)?;
    }
    // 检查最大长度
    if prog.len() > ebpf::PROG_MAX_SIZE {
     
        reject(...)?;
    }
    // 检查非空
    if prog.is_empty() {
     
        reject(...)?;
    }
    // 检查必须以EXIT结束
    let last_opc = ebpf::get_insn(prog, (prog.len() / ebpf::INSN_SIZE) - 1).opc;
    if last_opc & ebpf::BPF_CLS_MASK != ebpf::BPF_JMP {
     
        reject(...)?;
    }
    Ok(())
}

check_load_dw - LD_DW指令检查

fn check_load_dw(prog: &[u8], insn_ptr: usize) -> Result<(), Error> {
     
    // 获取下一条指令
    let next_insn = ebpf::get_insn(prog, insn_ptr + 1);
    // 下一条指令的操作码必须不为0
    if next_insn.opc != 0 {
     
        reject(...)?;
    }
    Ok(())
}

check_jmp_offset - 跳转指令检查

fn check_jmp_offset(prog: &[u8], insn_ptr: usize) -> Result<(), Error> {
     
    let insn = ebpf::get_insn(prog, insn_ptr);
    // 检查死循环
    if insn.off == -1 {
     
        reject(...)?;
    }
    // 检查跳转目标是否在程序范围内
    let dst_insn_ptr = insn_ptr as isize + 1 + insn.off as isize;
    if dst_insn_ptr < 0 || dst_insn_ptr as usize >= (prog.len() / ebpf::INSN_SIZE) {
     
        reject(...)?;
    }
    // 检查是否跳转到LD_DW指令的中间
    let dst_insn = ebpf::get_insn(prog, dst_insn_ptr as usize);
    if dst_insn.opc == 0 {
     
        reject(...)?;
    }
    Ok(())
}

check_registers - 寄存器访问检查

fn check_registers(insn: &ebpf::Insn, store: bool, insn_ptr: usize) -> Result<(), Error> {
     
    // 源寄存器检查
    if insn.src > 10 {
     
        reject(...)?;
    }
    // 目标寄存器检查
    match (insn.dst, store) {
     
        (0..=9, _) | (10, true) => Ok(()),  // R0-R9总是可写,R10仅在store=true时可写
        (10, false) => reject(...),         // 不可写入R10
        (_, _) => reject(...),               // 无效寄存器
    }
}

四、操作码分类

验证器支持的操作码分为以下几类:

  1. 加载类 (BPF_LD)

    • LD_ABS_B/H/W/DW - 固定偏移加载
    • LD_IND_B/H/W/DW - 间接偏移加载
    • LD_DW_IMM - 64位立即数加载(特殊处理)
  2. 存储类 (BPF_ST/BPF_STX)

    • ST_B/H/W/DW_IMM - 立即数存储
    • ST_B/H/W/DW_REG - 寄存器存储
  3. 算术逻辑运算类 (BPF_ALU/BPF_ALU64)

    • 32位和64位的加减乘除、位操作等
  4. 跳转类 (BPF_JMP/BPF_JMP32)

    • 条件跳转(等于、大于、小于等)
    • 无条件跳转 (JA)
    • 32位和64位版本
  5. 调用类 (BPF_CALL)

    • 普通调用 (CALL)
    • 尾调用 (TAIL_CALL)

五、总结

这个 eBPF 验证器虽然比 Linux 内核中的验证器简单,但它提供了基本的程序完整性检查:

  1. 确保程序格式正确
  2. 防止明显的安全风险(如无效内存访问)
  3. 验证指令序列的合法性

通过上述对源码进行解读,认识到验证器是虚拟机的门户,它保证了虚拟机的按照预定的规范的指令执行程序,保证了安全性和稳定性。

代码来源:rbpf虚拟机
鸣谢: qmonnet 提供的开源代码.

当然,我也会将带有中文注释和自己理解的一些代码上传的我的github页面,感兴趣的朋友可以进行clone查看.

我的GitHub:forked


感谢您的点赞、关注、收藏!

目录
相关文章
|
11月前
|
人工智能 运维 监控
基于MCP的一体化AI管线:从模型训练到部署监控的全链路解析
本文介绍基于MCP(模型控制流水线)的一体化AI部署架构,涵盖从模型训练、自动部署、实时推理到性能监控的完整闭环系统设计,并结合工业制造、能源、IoT等场景,提供代码实现与落地案例,助力企业实现AI自动化运维与智能化升级。
基于MCP的一体化AI管线:从模型训练到部署监控的全链路解析
|
11月前
|
编解码 vr&ar 芯片
详解工业AR眼镜关键技术之光学篇
AR眼镜的光学技术是影响显示效果与佩戴体验的核心,主要包括微显示与光波导技术。微显示决定分辨率、亮度与色彩表现,主流方案有LCOS、Micro-OLED与Micro-LED;光波导则实现轻薄化设计,分为几何波导与衍射波导,分别侧重亮度与厚度控制。未来发展方向为更轻薄、大视场角与低成本。
|
11月前
|
安全 算法 区块链
openssl生成证书
本文章是记录openssl命令生成私钥、证书签名请求、CA证书的命令和相关参数的解释。其中包含了各参数的名称、作用、技术细节和安全建议。
276 1
|
11月前
|
存储 算法 区块链
从零实现Python扫雷游戏:完整开发指南与深度解析
扫雷作为Windows经典游戏,承载了许多人的童年回忆。本文将详细介绍如何使用Python和Tkinter库从零开始构建一个功能完整的扫雷游戏,涵盖游戏设计、算法实现和界面开发的全过程。
783 1
|
11月前
|
存储 前端开发 测试技术
小试牛刀-区块链代币锁仓合约实战
记录一下自己在开发代币合约中的过程,加深自己对合约功能的理解,在后续的学习过程中可以进行资料查阅,以及帮助有这方面开发要求或想学习的朋友进行更方便的入门。
280 1
|
11月前
|
存储 JavaScript 区块链
小试牛刀-walletconnect二维码及交互
最近在使用walletconnect协议和typescript语言实现相关交互功能,在此对从walletconnet协议二维码生成、连接后发送交易事务、签名事务、签名任意信息的处理进行记录,加深对walletconnect的理解,熟悉对其组件的使用,同时希望帮助到有实现相关功能的朋友。
416 1
|
开发工具
修改IDEA的配置目录
修改IDEA的配置目录
1108 0
|
机器学习/深度学习 边缘计算 PyTorch
PyTorch团队为TorchAO引入1-8比特量化,提升ARM平台性能
PyTorch团队推出创新技术,在其低精度计算库TorchAO中引入低位运算符支持,实现1至8位精度的嵌入层权重量化及8位动态量化激活的线性运算符。该技术通过模块化设计和高效硬件利用,优化了资源受限环境下的深度学习计算,提升了计算效率并降低了资源消耗。新内核与PyTorch生态系统无缝集成,支持即时执行、编译优化及边缘计算,为开发者提供全方位性能优势。测试结果显示,多层次量化策略显著提升了计算效率,保持了模型精度。这一突破为深度学习框架优化开辟了多个研究方向,推动了人工智能在边缘计算等领域的广泛应用。
595 11
PyTorch团队为TorchAO引入1-8比特量化,提升ARM平台性能
|
机器学习/深度学习 计算机视觉
【YOLOv8改进】EMA(Efficient Multi-Scale Attention):基于跨空间学习的高效多尺度注意力 (论文笔记+引入代码)
YOLO目标检测专栏介绍了创新的多尺度注意力模块EMA,它强化通道和空间信息处理,同时降低计算负担。EMA模块通过通道重塑和并行子网络优化特征表示,增强长距离依赖建模,在保持效率的同时提升模型性能。适用于图像分类和目标检测任务,尤其在YOLOv8中表现出色。代码实现和详细配置可在文中链接找到。