带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(8)

简介: 带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(8)

带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(7) https://developer.aliyun.com/article/1243473?groupCode=taobaotech




立方体投影


立方体投影(Cube Map Projection, CMP) 是通过将球面内容投影在立方体模型上后将各个面展开,然后拼接为矩形的一种投影方式。立方体投影通过透视的形式实现从球面到立方体面的映射,具体的操作其实就是简单的坐标比例缩放。由于立方体模型具有极好的对称性,所以在与球面进行相互投影的过程中可以大大降低计算复杂度,并且面与面之间的投影关系是一致的。


相比等距柱状投影,立方体贴图的扭曲更小。将等圆柱映射的 4K 全景视频(3840×1920)转换为相同的正方体映射的分辨率为 2880×1920,文件大小缩小了近 1/3,这也是立方体贴图的优点之一。


但是在球面映射到几何体表面的方法中,放射型投影由于模型每个面的中心位置到球心的距离不同,越靠近边角的地方离球体越远,所以投影的不均匀性无法避免。


立方体投影格式的全景视频原始画面(传统立方体投影会按照下图格式将六个面进行排布):在下图的立方体投影方式及其横截面示意图中可以看出,经过圆心和圆周上每一点的射线是以同样的角度向外发射的,但是在投影到正方形的边上时,越靠近中点对应的线段长度越短,越远离中点则对应线段越长,即圆上相同长度的弧映射到正方形上之后长度是不等的。因而球面上相同数量的像素点,投影到立方体边缘区域所分配到的采样像素数量会多于投影到中心区域时所分配的采样像素数量(即边缘区域稀疏,中心区域稠密):


image.png

立方体投影格式的全景视频原始画面(传统立方体投影会按照下图格式将六个面进行排布):


image.png


等角度立方体投影


等角度立方体投影(Equi-Angular Cubemap, EAC) 则是谷歌所提出的一种对立方体投影改进方法,通过调整球面像素点对应的立方体上采样像素点的位置来改善这种不均匀的分布。EAC 在 CMP 的结果之上,额外做一个映射,将原本长度不同的块映射为相同:


image.png


这样做的好处就是在相同的源视频分辨率下可以提高细节部分的清晰度:


image.png



带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(9) https://developer.aliyun.com/article/1243470?groupCode=taobaotech


相关文章
|
人工智能 边缘计算 测试技术
MLPerf推理基准测试引入Llama 2 新结果公布
【4月更文挑战第5天】MLCommons发布了最新MLPerf推理基准测试结果,涉及数据中心和边缘计算,引入了大型语言模型Llama 2进行性能评估。Llama 2在OPEN ORCA数据集上的表现提升测试复杂性,提供了更全面的性能数据。MLPerf测试涵盖图像分类、对象检测等边缘计算任务,为开发者和研究人员提供参考。测试结果存在硬件和软件配置影响的局限性,但仍是衡量AI系统性能的重要标准。
538 9
MLPerf推理基准测试引入Llama 2 新结果公布
|
机器学习/深度学习
FFT能量归一化
FFT能量归一化
655 0
|
11天前
|
人工智能 定位技术 Go
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径
Harness Engineering 是一套让AI在真实项目中稳定、可靠交付的工程系统,涵盖SPEC规范、Rule约束、Skill流程、Sub-Agent分工、Workflow编排、Script校验与MCP集成。它不追求模型更聪明,而是通过结构化机制消除随意性,实现可验证、可维护、可持续的AI协作开发。
451 1
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径
|
Kubernetes Cloud Native 安全
容器技术之发展简史
容器技术催生了云原生思潮,云原生生态推动了容器技术发展。整理容器技术近 20 年的发展历史,大致可以将其分为四个历史阶段。
20922 1
容器技术之发展简史
|
9月前
|
人工智能 自然语言处理 搜索推荐
AI agent
AI Agent:从被动工具到主动伙伴,人工智能的下一场革命。它具备规划、工具调用、自主执行与迭代能力,不再是鹦鹉学舌的模型,而是能在数字世界替我们“动手做事”的智能体。依托大语言模型、推理框架与API工具链,AI Agent正重塑办公、客服、科研、生活等各领域,开启“人类指挥,AI执行”的人机协作新时代。尽管面临可靠性、安全与成本挑战,它仍标志着AI从“感知”迈向“行动”的关键跃迁。
|
安全 vr&ar
全息投影技术:三维影像的现实应用
【10月更文挑战第14天】全息投影技术以其独特的魅力和广泛的应用前景,正在逐步改变我们的生活和工作方式。通过深入了解其原理和应用,我们可以更好地利用这一技术,为各个领域的发展注入新的活力。让我们期待全息投影技术在未来带来的更多惊喜和变革。
1417 1
|
算法 数据中心 云计算
Xilinx IP 10Gigabit Ethernet Subsystem IP接口的详细说明
总的来说,Xilinx的10Gigabit Ethernet Subsystem IP是一个强大的,灵活的和高效的解决方案,它使得设计者能够快速、准确、高效地实现10Gbps的以太网连接。
838 25
|
Kotlin
Kotlin中接口、抽象类、泛型、out(协变)、in(逆变)、reified关键字的详解
Kotlin中接口、抽象类、泛型、out(协变)、in(逆变)、reified关键字的详解
453 0
|
机器学习/深度学习 人工智能
Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式
Qwen2VL-Flux 是一个开源的多模态图像生成模型,结合了 Qwen2VL 的视觉语言理解和 FLUX 框架,能够基于文本提示和图像参考生成高质量的图像。该模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及 ControlNet 引导生成,具备深度估计和线条检测功能,提供灵活的注意力机制和高分辨率输出,是一站式的图像生成解决方案。
1802 4
Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式