2022最火的AIGC落地怎么用,阿里达摩院团队深度解读

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: 2022最火的AIGC落地怎么用,阿里达摩院团队深度解读

2022 年,是 AIGC 爆发的一年。

从 DALL-E 2 到 Stable Diffusion,AIGC 赛道在这一年突然变得热闹起来,也引来了资本的青睐。前不久,Stable Diffusion 背后的 Stability AI 更是获得上亿美元投资,估值已高达 10 亿美元。

对于行业之外的普通人来说,不管 AI 作画还是 AI 写作,都是颇具新鲜感的前沿技术应用。而相关领域从业者或 AI 研究者可能思考得更深入一些。

具体到应用场景中,AIGC 是如何落地的?生成式 AI 技术将带来哪些想象空间?又将如何推动相关产业链的升级?

在最新一期的线上分享中,机器之心邀请到了阿里达摩院团队的多位 AI 专家,为我们介绍 AIGC 领域的最新进展。



在线上分享中,阿里巴巴达摩院机器智能语言技术实验室研究员黄非将作开场介绍。



嘉宾简介:黄非,阿里巴巴达摩院机器智能语言技术实验室研究员,自然语言基础技术,对话技术和多模态翻译团队负责人。他领导了 AliNLP 基础技术研发和业务落地,云小蜜对话技术和多模态翻译技术,并支持集团内外的国际化业务需求。黄非博士毕业于卡耐基梅隆大学计算机学院,之后在 IBM 和 Facebook 从事自然语言处理的研发和技术管理等职位。曾在自然语言处理和人工智能的顶级会议和期刊发表文章 40 多篇,获得美国专利 10 多项,曾担任 ACL,IJCAI,COLING 等多个 NLP 国际会议的领域主席 / 资深程序委员和多个期刊会议论文的审稿人。

分享主题一:阿里通义 - 文生图大模型技术解析与应用探索

分享摘要:本次分享将介绍大规模预训练扩散生成模型「通义 - 文生图」,它基于十亿量级图文数据训练,并通过对数据、模型、训练方式等多个维度优化以提升其收敛稳定性与可扩展性。「通义 - 文生图」的图文匹配得分超过 Imagen,目前已在魔搭ModelScope 平台开放体验,后续迭代版本将公开代码及预训练模型。


嘉宾简介:黄梁华,阿里巴巴算法专家,2020 年博士毕业于中国科学院自动化研究所。主要研究领域包括预训练表征与生成建模,在 TPAMI, CVPR, ICCV, ECCV, TIP, AAAI, ACMMM 等会议或期刊发表论文十余篇,引用量 1000+。其 TPAMI 论文曾多期入选 ESI 高被引论文与热点论文(全球 Top 0.1%)。近期的研究工作集中在多模态生成大模型预训练、通义 - 文生图大模型的技术研发。

分享主题二:AliceMind 预训练大模型在 AIGC 文本创作的探索

分享摘要:本次分享围绕AliceMind预训练大模型在AIGC 文本创作方向展开,介绍预训练生成大模型如何在AIGC领域发力,涉及到以下几个大模型模型的分享:1)中文超大规模生成模型PLUG;2)GPT-3的中文复现版本;3)多模态统一理解生成模型mPLUG。

相关模型链接


嘉宾简介:李晨亮,现为阿里巴巴达摩院高级算法工程师。2019 年硕士毕业于北京邮电大学。主要研究方向为自然语言处理,包括预训练语言模型、文本生成、多模态等。曾经在相关领域顶级会议如 ACL、EMNLP、AAAI 等发表十多篇相关论文。参与多个国际评测和比赛,在生成、结构化、多模态的多个相关评测榜单上达到第一,并在多模态 VQA 榜单上首次超越人类水平。



分享主题三:OFASys:一个面向多模态多任务统一学习的开源 AI 库

分享摘要:本次分享将介绍即将开源的一个用于构建单一模型来完成多模态多任务的开源库 OFASys。它首次支持了包括语音、视频、动作等 7 种模态及其 20 多种任务,可以在十行代码内引入一个新任务和数据集并协同训练。我们训练了一个 OFA + 模型可以同时完成以上 7 种模态的多数生成和理解任务,并达到下游单独 Finetune 效果平均的 90% 以上。


嘉宾简介:白金泽,阿里巴巴算法专家,2021 年博士毕业于北京大学。主要研究领域包括大模型预训练和多模态表征学习,曾在 AAAI、WWW、ICML 等会议发表多篇论文。近期的研究工作集中于多模态大模型 M6 的预训练基础技术,以及参与多模态多任务学习 OFA & OFASys 的技术研发。

相关文章
|
机器学习/深度学习 人工智能 自然语言处理
AIGC和ChatGPT推进百度、阿里、腾讯、华为大模型技术创新
据艾媒咨询预测,2023 年中国 AIGC 核心市场规模将达 79.3 亿元,2028 年将达 2767.4 亿元。中国互联网的高度普及率,以及不断提升的企业数字化程度,为 AIGC 产业提供了优越的发展环境。
|
2月前
|
人工智能 搜索推荐 数据库
实时云渲染技术赋能AIGC,开启3D内容生态黄金时代
在AIGC技术革命的推动下,3D内容生态将迎来巨大变革。实时云渲染与Cloud XR技术将在三维数字资产的上云、交互及传播中扮演关键角色,大幅提升生产效率并降低门槛。作为云基础设施厂商,抓住这一机遇将加速元宇宙的构建与繁荣。AIGC不仅改变3D内容的生成方式,从手工转向自动生成,还将催生更多3D创作工具和基础设施,进一步丰富虚拟世界的构建。未来,通过文本输入即可生成引人注目的3D环境,多模态模型的应用将极大拓展创作的可能性。
|
8月前
|
存储 自然语言处理 API
通义万相AIGC技术Web服务体验评测
随着人工智能技术的不断进步,图像生成技术已成为创意产业的一大助力。通义万相AIGC技术,作为阿里云推出的一项先进技术,旨在通过文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,加速艺术家和设计师的创作流程。本文将详细评测这一技术的实际应用体验。
264 4
|
2月前
|
编解码 人工智能 算法
国家扶持超高清产业背景下:视频云AIGC的超高清技术实践
本次分享由阿里云视频云高级产品解决方案架构师陈震主讲,聚焦国家扶持超高清产业背景下,视频云AIGC的超高清技术实践。内容涵盖超高清产业发展趋势与挑战、阿里视频云的应对方案及应用案例。通过全链路超高清解决方案,结合AI、云计算等技术,提供从内容生产、传输到播放的完整支持,助力行业应对超高清视频带来的技术与市场挑战。
|
2月前
|
人工智能 编解码 安全
全球AI新浪潮:智能媒体服务的技术创新与AIGC加速出海
本文介绍了智能媒体服务的国际化产品技术创新及AIGC驱动的内容出海技术实践。首先,探讨了媒体服务在视频应用中的升级引擎作用,分析了国际市场的差异与挑战,并提出模块化产品方案以满足不同需求。其次,重点介绍了AIGC技术如何推动媒体服务2.0智能化进化,涵盖多模态内容理解、智能生产制作、音视频处理等方面。最后,发布了阿里云智能媒体服务的国际产品矩阵,包括媒体打包、转码、实时处理和传输服务,支持多种广告规格和效果追踪分析,助力全球企业进行视频化创新。
|
4月前
|
人工智能 自然语言处理 数据可视化
什么是AIGC?如何使用AIGC技术辅助办公?
2分钟了解AIGC技术及其如何提高日常办公效率!
244 4
什么是AIGC?如何使用AIGC技术辅助办公?
|
5月前
|
人工智能 自然语言处理 数据挖掘
Claude 3.5:一场AI技术的惊艳飞跃 | AIGC
在这个科技日新月异的时代,人工智能(AI)的进步令人惊叹。博主体验了Claude 3.5 Sonnet的最新功能,对其卓越的性能、强大的内容创作与理解能力、创新的Artifacts功能、视觉理解与文本转录能力、革命性的“computeruse”功能、广泛的应用场景与兼容性以及成本效益和易用性深感震撼。这篇介绍将带你一窥其技术前沿的魅力。【10月更文挑战第12天】
217 1
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
探索AIGC的底层技术:人工智能通用计算架构
探索AIGC的底层技术:人工智能通用计算架构
377 3
|
5月前
|
人工智能 自然语言处理 搜索推荐
超越边界:探索2023年AIGC技术盛宴,预测前沿科技的奇迹 🚀
本文探讨了互联网内容生产从PGC、UGC到AIGC的演变,特别关注了AIGC(人工智能生成内容)的发展及其对未来内容生产的深远影响。文章详细介绍了AIGC的定义、技术进展(如生成算法、多模态技术、AI芯片等),并展示了AIGC在多个领域的广泛应用,如代码生成、智能编程、个性化服务等。未来,AIGC将在各行各业创造巨大价值,推动社会进入更加智能化的时代。同时,文章也探讨了AIGC对开发者的影响,以及其可能无法完全取代人类的原因,强调开发者可以利用AIGC提升工作效率。
104 0
|
7月前
|
机器学习/深度学习 数据采集 人工智能
作为AIGC技术的一种应用-bard
8月更文挑战第22天
132 15

热门文章

最新文章