带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(9)

简介: 带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(9)

带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(8) https://developer.aliyun.com/article/1243471?groupCode=taobaotech




等角度立方体投影格式的全景视频原始画面(文字方向都是基于旋转后天空在上、地面在下、画面方向正常的情况标注的):


image.png


观察截图可以发现,画面上半部分即为面向前方时的横向(左右)扫视图,下半部分逆时针旋转 90° 后即为面向后方时的纵向(上下)扫视图。


从投影质量、投影效率和带宽来进行对比,EAC 是三者中最优的。但由于历史和易于展示/编辑的原因,市面上摄像设备普遍产出的是 ERP 投影的全景视频。


在新零售工作台上,商家上传的是 ERP 投影的全景视频,上传后内容中台将转换为 EAC 投影来供手淘进行渲染播放。我们的封面视频生成环节是在商家的上传流程中,因此需要渲染的是 ERP 投影的全景视频。


3D 渲染基础知识


了解完投影的方式,接下来看如何实现投影。这部分涉及到一些 3D 渲染的基础知识。


想在屏幕上展示 3D 物体,大体上的思路是这样的:


1. 创建一个三维空间,称之为场景(Scene)

2. 确定一个观察点,并设置观察的方向和角度,称之为相机(Camera)

3. 在场景中添加供观察的物体(Objects),物体有网格(Mesh), 线(Line), 点(Points)等

4. 最后我们需要把所有的东西渲染到屏幕上


下面来具体看一看这些概念。


场景


场景(Scene)是所有物体的容器,也对应着我们创建的三维世界。


相机


相机(Camera)就相当于我们的眼睛,为了观察这个世界,我们需要描述某个物体的位置。描述物体位置需要用到坐标系。常用的坐标系有左手坐标系和右手坐标系。


image.png


常用的有两种相机,正投影相机(OrthographicCamera)和透视投影相机(PerspectiveCamera):


image.png


上面左图是正交投影,物体反射的光平行投射到屏幕上,其大小始终不变,所以远近的物体大小一样。在渲染一些 2D 效果和 UI 元素的时候会用到;右图是透视投影,符合我们平时看东西的感觉,近大远小,经常用在 3D 场景中。



带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(10) https://developer.aliyun.com/article/1243469?groupCode=taobaotech



相关文章
|
11天前
|
人工智能 定位技术 Go
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径
Harness Engineering 是一套让AI在真实项目中稳定、可靠交付的工程系统,涵盖SPEC规范、Rule约束、Skill流程、Sub-Agent分工、Workflow编排、Script校验与MCP集成。它不追求模型更聪明,而是通过结构化机制消除随意性,实现可验证、可维护、可持续的AI协作开发。
445 1
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径
|
机器学习/深度学习 算法 前端开发
公开下载 |《2022技术人的百宝黑皮书》来了!
大淘宝技术2022一整年干货合集,你今年错过的知识和分享,还来得及补救。
1572 0
公开下载 |《2022技术人的百宝黑皮书》来了!
|
机器学习/深度学习 人工智能
Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式
Qwen2VL-Flux 是一个开源的多模态图像生成模型,结合了 Qwen2VL 的视觉语言理解和 FLUX 框架,能够基于文本提示和图像参考生成高质量的图像。该模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及 ControlNet 引导生成,具备深度估计和线条检测功能,提供灵活的注意力机制和高分辨率输出,是一站式的图像生成解决方案。
1800 4
Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式
|
JavaScript
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(12)
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(12)
285 0
|
编解码
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(8)
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(8)
282 0
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(10)
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(10)
254 0
|
存储 JavaScript 前端开发
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(11)
带你读《2022技术人的百宝黑皮书》——全景封面视频生成技术在淘宝的应用(11)
308 0
|
10天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
11天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
797 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图