《中国人工智能学会通讯》——11.9 点云局部特征描述算法

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.9节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.9 点云局部特征描述算法

在模式识别任务中,特征提取一直具有十分重要的作用。在三维计算机视觉领域,点云特征提取是点云配准、三维模型重建、三维形状检索、三维目标识别,以及三维生物特征识别等应用的基础。现有特征提取算法可分为全局特征和局部特征两大类[1] 。全局特征利用点云中所有点的信息构建得到,这类特征包含的信息较丰富,但同时对遮挡及背景干扰等十分敏感。而局部特征则首先在点云上检测一系列具有丰富信息的关键点,进而采用关键点局部邻域内的几何信息构建特征描述子,因此其对遮挡及背景干扰非常稳健。

一个良好的特征描述子应该具备以下几个基本条件:① 对物体刚性变换的不变性;② 较高的鉴别力;③ 较好的鲁棒性,对噪声、遮挡、分辨率变化,以及缺失点等常见干扰因素稳健。现有特征描述子难以同时满足上述三个要求,针对此,本文提出了一种高鉴别力且稳健的 RoPS 特征描述子[2] 。

RoPS 特征描述子示意图如图 1 所示,其基本生成过程如下所述。

(1) 在点云的每个关键点上构建一个局部参考坐标框架,并将局部表面上的点变换到该坐标框架下,以获得局部特征描述子对物体姿态变化的不变性,如图 1(a) 和 (b) 所示。

(2) 将关键点局部邻域点云 Q 绕 x 轴旋转一个角度 θ k ,得到旋转后的点云 Q(θ k ),如图 1(c) 所示。进而将点云 Q(θ k ) 投影到 xy、xz 和 yz 三个坐标平面上,以获得三个投影点云 i (θ k ),其中 i= 1, 2, 3。

(3) 获取每一个投影点云 i (θ k ) 的包围矩形,并将该包围矩形均匀划分成 M×M 个单元格 ( 如图1(d) 所示 ),统计落入每个单元格内的投影点数量从而获得分布矩阵 D( 如图 1(e) 所示 )。
image

(4) 得到分布矩阵 D 后,采用计算复杂度低但表达能力强的中心矩和香农熵等五个数学统计量来表征该矩阵中的信息。

(5) 为全面记录该局部表面的信息,将点云 Q绕 x 轴旋转多个角度,并将每个投影平面上得到的五维数学统计量组合成一个子特征 f x 。然后,将点云 Q 绕 y 轴和 z 轴旋转多个角度以分别得到子特征f y 和 f z 。最后,将所有子特征组合得到 RoPS 特征描述子。

采 用 Bologna 和 Photomesh 数 据 集 测 试 了RoPS 特征描述子的性能并与现有算法进行了充分对比,部分结果如图 2 所示。实验结果表明,RoPS特征描述子具有如下优点。

(1) 鉴别力强:RoPS 通过旋转投影实现从多个视角记录局部表面的“完整”信息,因而信息量丰富。

(2) 不变性:通过构建局部参考坐标框架实现局部表面的姿态归一化,使得到的特征描述子具有对旋转和平移的不变性。

(3) 对噪声稳健:由于在各个二维投影平面上均进行稀疏划分且只采用低阶矩而非高阶矩来生成特征描述子,因而 RoPS 对噪声非常稳健。

(4) 对分辨率变化稳健:RoPS 通过计算局部表面上所有点而非仅仅三角面片顶点的协方差矩阵得到局部参考坐标框架,因而对数据分辨率变化不敏感。

(5) 紧凑性:将三维点云投影到二维平面并在二维平面提取五维特征的过程极大地降低了数据量,使得 RoPS 特征描述子维度较低。

image

目录
打赏
0
0
0
1
325
分享
相关文章
阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级
本文介绍了阿里云 AI 搜索开放平台的技术的特点及其在各行业的应用。
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
291 5
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
本文介绍了通义灵码2.0 AI程序员在嵌入式开发中的实战应用。通过安装VS Code插件并登录阿里云账号,用户可切换至DeepSeek V3模型,利用其强大的代码生成能力。实战案例中,AI程序员根据自然语言描述快速生成了C语言的base64编解码算法,包括源代码、头文件、测试代码和CMake编译脚本。即使在编译错误和需求迭代的情况下,AI程序员也能迅速分析问题并修复代码,最终成功实现功能。作者认为,通义灵码2.0显著提升了开发效率,打破了编程语言限制,是AI编程从辅助工具向工程级协同开发转变的重要标志,值得开发者广泛使用。
8122 69
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
69 6
如何在Python下实现摄像头|屏幕|AI视觉算法数据的RTMP直播推送
本文详细讲解了在Python环境下使用大牛直播SDK实现RTMP推流的过程。从技术背景到代码实现,涵盖Python生态优势、AI视觉算法应用、RTMP稳定性及跨平台支持等内容。通过丰富功能如音频编码、视频编码、实时预览等,结合实际代码示例,为开发者提供完整指南。同时探讨C接口转换Python时的注意事项,包括数据类型映射、内存管理、回调函数等关键点。最终总结Python在RTMP推流与AI视觉算法结合中的重要性与前景,为行业应用带来便利与革新。
Python下的毫秒级延迟RTSP|RTMP播放器技术探究和AI视觉算法对接
本文深入解析了基于Python实现的RTSP/RTMP播放器,探讨其代码结构、实现原理及优化策略。播放器通过大牛直播SDK提供的接口,支持低延迟播放,适用于实时监控、视频会议和智能分析等场景。文章详细介绍了播放控制、硬件解码、录像与截图功能,并分析了回调机制和UI设计。此外,还讨论了性能优化方法(如硬件加速、异步处理)和功能扩展(如音量调节、多格式支持)。针对AI视觉算法对接,文章提供了YUV/RGB数据处理示例,便于开发者在Python环境下进行算法集成。最终,播放器凭借低延迟、高兼容性和灵活扩展性,为实时交互场景提供了高效解决方案。
109 4
细思极恐,GPT-4竟串谋AI欺骗人类!哈佛PSU重磅揭秘算法共谋,AI教父预言正成真
近日,哈佛大学和宾夕大合著的重磅论文揭示,基于大型语言模型(如GPT-4)的算法可能自主串谋,损害消费者利益。研究发现,这些算法在虚拟市场中能迅速达成默契,提高价格以获取更高利润,类似于人类垄断行为。这一现象曾被DeepMind联合创始人Shane Legg预言,如今成为现实。论文呼吁加强对AI的监管,确保其透明性和可解释性,以防止潜在风险,并促进AI的可持续发展。
49 6
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
《PatternBoost: Constructions in Mathematics with a Little Help from AI》提出了一种结合传统搜索算法和Transformer神经网络的PatternBoost算法,通过局部搜索和全局优化交替进行,成功应用于组合数学问题。该算法在图论中的Ramsey数研究中找到了更小的反例,推翻了一个30年的猜想,展示了AI在数学研究中的巨大潜力,但也面临可解释性和通用性的挑战。论文地址:https://arxiv.org/abs/2411.00566
121 13
基于分块贝叶斯非局部均值优化(OBNLM)的图像去噪算法matlab仿真
本项目基于分块贝叶斯非局部均值优化(OBNLM)算法实现图像去噪,使用MATLAB2022A进行仿真。通过调整块大小和窗口大小等参数,研究其对去噪效果的影响。OBNLM结合了经典NLM算法与贝叶斯统计理论,利用块匹配和概率模型优化相似块的加权融合,提高去噪效率和保真度。实验展示了不同参数设置下的去噪结果,验证了算法的有效性。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等