读《2022技术人的百宝黑皮书》之感

简介: 黑皮书定义数字人的三个核心要素——形,动,神,从外观、行为到思想均无限趋近于真人特征,拟人态越高,数字人越逼真,越具备实用性和商用性。

2022年,淘宝工程师在完成工作任务的情况下,将各种技术,思想和研究进行了总结,并将其免费分享出来,于是我们有幸拜读到这份《2022技术人的百宝黑皮书》。纵览黑皮书内容,内容丰富全面,涵盖了终端技术、服务端架构、音视频与图像技术、3DXR技术、技术质量、数据算法等多个技术领域,我们选3DXR中的虚拟数字人这个当前最火热的方向来谈一谈阅读后的收获。
元宇宙在资本市场大火之后,大家一直在探寻元宇宙是什么,普通人目前能看到的元宇宙产品是什么?虚拟数字人被认为是最先为大家所知的元宇宙形象,记得2021年抖音虚拟人柳夜熙一夜爆火,一天涨粉百万,体现了大家对虚拟数字人的喜爱。黑皮书定义数字人的三个核心要素——形,动,神,从外观、行为到思想均无限趋近于真人特征,拟人态越高,数字人越逼真,越具备实用性和商用性。
形,通过模型设计、捏脸、骨骼蒙皮、混合变形、换装和美颜、渲染和真实感绘制这一系列步骤,实现成虚拟数字人的形 - “具备人或拟人的外观,具有特定的相貌等人物特征”。
动,通过真实且细腻的表情和动作、手K动画、动作捕捉、动作编排等方法完成虚拟数字人的动 - “拥有和人相似的行为,具有用语言、表情和肢体等表达的能力”。
神,当然虚拟数字人的产品和研究,在神上面是最难的,也是未来的核心研究方向,“拥有比拟人的思想,具有识别外界环境、并能与人交流互动的能力”,有一个词形容的比较好——传神,我们希望看到一个真正活过来,能够进行思考的数字人,到那时机器人大时代将真正到来。
未来,超写实渲染、微表情、肌肉模拟、物理材质、光线追踪、XR/6G、脑机接口等技术的发展将让虚拟数字人越来越成熟,能说会道,能写能画,游戏,直播,客服,旅游,销售,演唱会,视频创作,机器人等行业都会迎来大变革,有效解决劳动力不足和人力成本高企的问题,提高社会生产力,推动经济发展。

相关文章
|
消息中间件 缓存 关系型数据库
Flink CDC产品常见问题之upsert-kafka增加参数报错如何解决
Flink CDC(Change Data Capture)是一个基于Apache Flink的实时数据变更捕获库,用于实现数据库的实时同步和变更流的处理;在本汇总中,我们组织了关于Flink CDC产品在实践中用户经常提出的问题及其解答,目的是辅助用户更好地理解和应用这一技术,优化实时数据处理流程。
|
存储 JSON 网络协议
ElasticsearchRestTemplate客户端使用
ElasticsearchRestTemplate客户端使用
|
9月前
|
人工智能 数据挖掘 测试技术
大模型代肝,自动刷《崩铁》升级材料,Claude操纵计算机还能这么用!
Claude 3.5 Computer Use是首个提供公共测试的具备图形用户界面(GUI)操作能力的前沿AI模型,标志着GUI自动化领域的重要突破。它通过API调用实现端到端解决方案,能根据用户指令和视觉GUI状态生成操作,无需外部知识辅助。研究展示了其在网页搜索、工作流和生产力软件等任务中的卓越能力,并揭示了滚动导航等局限性。未来有望进一步优化并拓展应用领域。论文链接:https://arxiv.org/pdf/2411.10323。
336 38
|
7月前
|
人工智能 API 计算机视觉
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果
AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用,支持人物与服装照片智能合成,可生成多达10种试穿效果版本,并提供自定义提示词优化功能。
588 18
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果
|
机器学习/深度学习 编解码 负载均衡
MoH:融合混合专家机制的高效多头注意力模型及其在视觉语言任务中的应用
本文提出了一种名为混合头注意力(MoH)的新架构,旨在提高Transformer模型中注意力机制的效率。MoH通过动态注意力头路由机制,使每个token能够自适应选择合适的注意力头,从而在减少激活头数量的同时保持或提升模型性能。实验结果显示,MoH在图像分类、类条件图像生成和大语言模型等多个任务中均表现出色,尤其在减少计算资源消耗方面有显著优势。
396 1
|
Python 机器学习/深度学习 人工智能
手把手教你从零开始构建并训练你的第一个强化学习智能体:深入浅出Agent项目实战,带你体验编程与AI结合的乐趣
【10月更文挑战第1天】本文通过构建一个简单的强化学习环境,演示了如何创建和训练智能体以完成特定任务。我们使用Python、OpenAI Gym和PyTorch搭建了一个基础的智能体,使其学会在CartPole-v1环境中保持杆子不倒。文中详细介绍了环境设置、神经网络构建及训练过程。此实战案例有助于理解智能体的工作原理及基本训练方法,为更复杂应用奠定基础。首先需安装必要库: ```bash pip install gym torch ``` 接着定义环境并与之交互,实现智能体的训练。通过多个回合的试错学习,智能体逐步优化其策略。这一过程虽从基础做起,但为后续研究提供了良好起点。
1908 4
手把手教你从零开始构建并训练你的第一个强化学习智能体:深入浅出Agent项目实战,带你体验编程与AI结合的乐趣
|
SQL 关系型数据库 MySQL
问题1:Navicat连接不上mysql8的简单解决办法
问题1:Navicat连接不上mysql8的简单解决办法
2456 2
|
存储 缓存 运维
Lustre架构介绍的阅读笔记-HSM
HSM(Hierarchical Storage Management)是数据分级存储管理,根据数据生命周期、访问特性和设备成本,自动在CPU寄存器、缓存、主存、SSD、HDD、光盘、磁带库等不同存储层级间迁移数据。数据热度分为热、温、冷、冰,对应不同成本、性能和容量。迁移策略可基于人工判断或系统自动计算,并确保业务I/O不受影响、数据一致性。访问频率增加时,数据可反向迁移至更高层级。
343 2
|
API 计算机视觉
【OpenCV】—图像对比度、亮度值调整
【OpenCV】—图像对比度、亮度值调整
312 1
|
存储 SQL 前端开发
瑞吉外卖精华部分总结(1)
瑞吉外卖精华部分总结(1)
439 0