2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

简介: 2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

image.png

内容一览:2022 年 AI 领域发展不断提速,新技术成果纷纷落地,模型迭代加速升级。本文总结了 2022 年 AI 领域各大公司的技术成就。关键词:年终盘点   大厂   技术创新

2022 年在此起彼伏的咳嗽声中接近尾声,这一年,AIGC 成为人工智能领域最大黑马,ScienceAI 有了更多实际落地的应用,这一年我们经历了各大厂商缩减预算、裁撤员工,也体验了绝处逢生的技术狂欢……

今天,我们将通过这篇文章,与各位同行共同回顾 2022 年那些人工智能领域具有突破性意义的研发成果。

data2vec

语音、视觉及文本自监督学习的通用框架

发布机构:Meta AI

发布时间:2022 年 1 月

项目地址:https://github.com/facebookre...

data2vec 是一个大一统的多模态自监督学习模型,可以以较高的性能处理图像、文本、语音等任务。12 月 16 日 data2vec 2.0 发布,与现有的计算机视觉自监督算法相比,相同精度下速度快了 16 倍。

image.png

data2vec 2.0 原理简介

AlphaCode

竞赛级别代码生成 AI

发布机构:DeepMind

发布时间:2022 年 2 月

项目地址:https://github.com/deepmind/c...

借助大型语言模型,依据问题的语言描述构建代码。在 Codeforces 挑战赛中,AlphaCode 击败了 46% 的参赛者。该研究不仅登上了 Science 封面,还被该杂志评入年度十大科学突破。

image.png

AlphaCode 概览

Dall·E 2

文本到图像的生成工具

发布机构:OpenAI

发布时间:2022 年 4 月

项目地址:https://openai.com/dall-e-2/

Dall·E 2 依据文本描述,可以创建更加具有现实主义色彩的艺术图像。与 OpenAI 2021 年发布的 Dall·E 相比,Dall·E 2 可以生成更真实、更准确的图像,且分辨率提高了 4 倍。

image.png

An astronaut riding a horse in a photorealistic style

Dall·E 2 生成的图像示例

Gato

全能型智能体

发布机构:DeepMind

发布时间:2022 年 5 月

项目地址:https://www.deepmind.com/blog...

Gato 是一个全能型智能体,可以玩雅达利游戏、对图像进行描述、聊天以及根据上下文决定输出文本、关节扭力或其他 token。这种通用模型解决所有任务类似人工智能,最终或超过特定于专门领域的模型。

image.png

ESM Fold

蛋白质结构预测模型

发布机构:Meta AI

发布时间:2022 年 7 月

项目地址:https://github.com/facebookre...

ESM Fold 是一个预测蛋白质序列的模型,能够直接进行高准确度、端对端、原子层级结构预测。它仅使用单个输入序列,只需查看单个蛋白质序列,这极大加快了推理速度。

image.png

用 ESM Fold 进行单序列结构预测

Make-A-Video

依据文本生成视频的 AI 系统

发布机构:MetaAI

发布时间:2022 年 9 月

项目地址:https://makeavideo.studio/

Make-A-Video 是一个文本-视频生成模型,它通过带有文字描述的图像,来学习常用的描述方式,同时使用无标签视频,了解和学习移动方式。Make-A-Video 生成的视频风格多样,对文本还原度高,是生成短视频方面的 SOTA 模型。

image.png

AlphaTensor

依据文本描述生成视频的部分示例改进矩阵乘法,提升计算速度

发布机构:DeepMind

发布时间:2022 年 10 月

项目地址:https://github.com/deepmind/a...

AlphaTensor 改进了目前最优的 4*4 矩阵乘法,并且进一步提升了其他 70 余种不同大小矩阵乘法计算速度。该成果登上了 Nature 封面,被 Scinece 杂志评入年度十大科学突破。

image.png

AlphaTensor 架构一览

Magic 3D text-to-3D content 创建工具

发布机构:NVIDIA

发布时间:2022 年 11 月

项目地址:https://deepimagination.cc/Ma...

NVIDIA 入局 AIGC,凭文字描述就可生成 3D Mesh 模型。它结合 image conditioning 技术以及基于文本提示的编辑方法,提供了一个控制 3D 合成的新思路,使得创建高质量 3D Mesh 模型成为可能。

image.png

Magic 3D 通过两个阶段创建 text-to-3D content

ChatGPT

超级对话模型

发布机构:OpenAI

发布时间:2022 年 11 月

项目地址:https://openai.com/blog/chatgpt/

ChatGPT 的训练使用了 RLHF (Reinforcement Learning from Human Feedback),与 InstructGPT 使用的方法相同,仅在数据收集设置上有细微差别。ChatGPT 可以像人类一样聊天交流,完成撰写邮件、视频脚本、文案、翻译及代码等任务。自上线以来,引起了海内外无数开发者的争相试用和热烈讨论,堪称 2022 年开发人员参与度最高的技术项目。

image.png

ChatGPT 训练过程概览

Point·E

依据文本描述生成 3D 点云

发布机构:OpenAI

发布时间:2022 年 12 月

项目地址:https://github.com/openai/poi...

用 Point·E 依据文本提示生成 3D 点云的过程分为三个步骤:1、依据文本提示,生成一个合成视图 (synthetic view)2、依据合成视图,生成 coarse point cloud (1024 point)3、基于低分辨率点云和合成视图,生成 fine point cloud (4096 Point)利用 Point·E 单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力消耗时代。

image.png

冬去春来,畅想 2023

2022 即将画上句点,2023 注定是充满未知的一年,AIGC 领域会有哪些新成果?ScienceAI 将如何应对基础科学与 AI 交叉带来的挑战?芯片研发、国产操作系统,又会产生哪些新突破?你对 2023 年人工智能领域的技术和应用有哪些预判,欢迎留言交流讨论~

相关文章
|
3月前
|
人工智能 数据安全/隐私保护
如何识别AI生成内容?探秘“AI指纹”检测技术
如何识别AI生成内容?探秘“AI指纹”检测技术
482 119
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI检测技术:如何识别机器生成的“数字指纹”?
AI检测技术:如何识别机器生成的“数字指纹”?
306 115
|
3月前
|
人工智能 自然语言处理 算法
揭秘AI文本:当前主流检测技术与挑战
揭秘AI文本:当前主流检测技术与挑战
625 115
|
3月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
3月前
|
人工智能 新制造
TsingtaoAI受邀参加宁波AI海曙科创训练营并分享技术落地实践
10月12日至15日,由宁波市海曙区组织部主办的AI海曙科创训练营在宁波成功举办。作为受邀企业代表,TsingtaoAI团队深入参与了多项活动,与政府领导、行业专家及科创企业代表围绕AI技术在制造业、成果转化等领域的实际应用展开交流,用真实案例诠释了“技术扎根产业”的价值逻辑。
127 2
|
3月前
|
机器学习/深度学习 人工智能 算法
AI可以做电商主图了:技术原理,AI电商图生成工具对比及技术解析
双十一临近,电商主图需求激增。AI技术凭借多图融合、扩散模型等,实现高效智能设计,30秒生成高质量主图,远超传统PS效率。支持风格迁移、背景替换、文案生成,助力商家快速打造吸睛商品图,提升转化率。
1165 0
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
如何准确检测AI生成内容?这三大技术是关键
如何准确检测AI生成内容?这三大技术是关键
821 116
|
3月前
|
人工智能 机器人 人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
337 117
|
3月前
|
机器学习/深度学习 人工智能 算法
AI生成内容的“指纹”与检测技术初探
AI生成内容的“指纹”与检测技术初探
310 9