带你读《2022技术人的百宝黑皮书》——移动端人脸风格化技术的应用(5) https://developer.aliyun.com/article/1243347?groupCode=taobaotech
展望
1.优化数据集:不同角度图像数据、质量优化;
2.整体链路的优化、改进、重设计;
3.更好的数据生成:StyleGAN3、Inversion算法、模型融合、风格编辑/创造、few-shot;
4.非监督两域翻译:利用较高匹配度的生成数据对做半监督,生成模型结构优化(例如引入傅里叶卷积);
5.有监督两域翻译:vid2vid 、帧间稳定性提升、极限场景的优化、细节的稳定性;
6.全图风格化/数字创作:disco diffusion、dalle2,style transfer。
参考文献
团队介绍
我们是大淘宝技术多媒体生产&视频内容理解算法团队,依托于淘宝天猫数十亿级的视频/图像数据,致力于提供从看点商品多媒体生产到前台视频理解推荐的全链路视觉算法方案。在端云一体的图像/视频处理、跨模态视频内容理解、AR直播、3D数字场、内容智能生产、审核、检索和高层语义理解等技术领域上,持续探索及发力以驱动产品和商品创新;在支持淘宝直播、逛逛、点淘等天猫淘宝内容业务的同时,也通过自研的内容中台为阿里集团内的钉钉、闲鱼、优酷等内容业务提供视觉算法能力支持。我们不断吸引及欢迎机器学习、视觉算法、NLP算法、端侧智能等领域人才的加入,欢迎联系 judyzha.zjl@alibaba-inc.com。