近日,美团联合创始人王慧文在朋友圈高调发声,表示愿意带资 5000 万美元(约合人民币 3.4 亿元)入组并进军人工智能,以打造中国版 OpenAI 和 ChatGPT。
与此同时,国内也开始支持 ChatGPT 类大模型的研究。
昨日,在北京举行的北京人工智能产业创新发展大会上,北京市经济和信息化局正式发布了《2022 年北京人工智能产业发展白皮书》。白皮书显示,截至 2022 年 10 月,北京拥有人工智能核心企业 1048 家,占我国人工智能核心企业总量的 29%。
白皮书还提到,今年北京市将引导企业、高校、科研院所、新型研发机构、开源社区等,围绕人工智能关键核心技术创新协同攻关,持续推动建设具有全球影响力的人工智能创新策源地。同时,支持头部企业打造对标 ChatGPT 的大模型,构建开源框架和通用大模型的应用生态,形成人工智能产业发展新突破。
ChatGPT 是多项 AI 技术的集大成者,背后离不开庞大的算力、人才等资源的支持。因此,国内各大科技公司自然被寄予厚望。这些公司最近也纷纷做出了表态。在这篇文章中,机器之心通过向企业求证、根据网络公开信息整理,为大家梳理了一下各大公司的回应以及这些公司现有的技术储备,希望为大家提供一些参考。
百度:「文心一言」3 月见
在国内众多科技大厂中,百度是最早针对 ChatGPT 做出明确表态的公司之一。2 月 7 日,百度正式官宣将在 3 月上线百度版 ChatGPT——「文心一言」(英文名为 ERNIE Bot)。
针对 ChatGPT 背后的技术,百度也给出了回应,称「ChatGPT 相关技术,百度都有。」「百度在人工智能四层架构中有全栈布局,包括底层芯片、深度学习框架、大模型以及最上层的搜索等应用。」而文心一言位于模型层。
这个模型层的产业级知识增强「文心」系列大模型已经布局多年,具备跨模态、跨语言的深度语义理解与生成能力。2019 年开始,百度深耕预训练模型研发,先后发布知识增强文心(ERNIE)系列模型。文心系列模型基于持续学习的语义理解框架,从大规模知识和海量数据中融合学习,效率更高,效果更好。2021 年 12 月,ERNIE 3.0 升级为全球首个知识增强千亿大模型鹏城 - 百度・文心,同时,产业级知识增强大模型文心全景图亮相。文心大模型在历次升级中持续加强知识增强,使之成为与产业级并列的两大核心特色之一。
知情人士透露,百度搜索早就接入了文心相关技术,「文心一言」的推出或将对百度搜索的升级起到重大作用。前段时间,百度 CEO 李彦宏将 2023 年一季度 OKR 关键任务定为「引领搜索体验的代际变革」。同时,李彦宏提到,ChatGPT 相关技术已达到临界点,百度在其中有较大的机会。
「这很宏伟,很激动人心。但我们认为它是可实现的,因为技术已经到了临界点。类似 ChatGPT 这样的技术很火,如何用在搜索场景上,这是比技术本身更难探索的。怎么能把这件事情做出来,让每天有几亿人从中受益,让他们的效率有明显的提升?未来一年,在这方面我们非常有机会。」李彦宏称。
「此次文心一言落地,首站将直接接入百度搜索。」知情人士透露,「一些相关功能已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等」。
相关阅读:
华为:在大模型领域早有布局
和百度不同,华为这一轮的回应并没有透露对标 ChatGPT 的具体计划,而是对自家在大模型方面的投入进行了简短回顾。
华为计算产品线相关负责人表示,公司 2020 年在大模型领域开始有布局,2021 年基于昇腾 AI 与鹏城实验室联合发布了鹏程。盘古大模型,是业界首个千亿级生成和理解中文 NLP 大模型。在模型性能方面,当时的鹏程。盘古大模型性能全球领先,16 个下游任务中性能指标优于业界 SOTA 模型。在应用方面,鹏程。盘古支持丰富的应用场景,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出。
该负责人还表示,在大模型产业化方面,华为已发起了智能遥感开源生态联合体、多模态人工智能产业联合体、智能流体力学产业联合体等。华为将以联合体的模式把科研院所、产业厂商等结合起来,更好地让大模型产业形成正向的闭环回路。
这些联合体由国内多个学界、业界机构组成,他们围绕自身与华为构建的一些基础设施展开大模型研究。比如:
- 中科院自动化所基于昇思 MindSpore 打造了全球首个千亿参数三模态大模型紫东。太初,通过跨模态语义关联达成了视觉 - 文本 - 语音三模态的统一表达和高效协同;
- 鹏城实验室基于昇思 MindSpore AI 框架打造了面向生物医学领域的 AI 平台 —— 鹏程。神农,包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等模块,深度赋能生物制药;
- 武汉大学利用武汉人工智能计算中心 AI 集群推出了武汉.LuoJia,包含全球首个遥感影像智能解译专用框架武汉.LuoJiaNET 和业界最大遥感影像样本数据集武汉.LuoJiaSET,并已于今年 6 月分别上线昇腾和昇思社区;
- ……
- 相关阅读:
腾讯:在相关方向上已有布局
腾讯对 ChatGPT 的回应发布于 2 月 9 日。该公司表示:「目前,腾讯在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入 AI 等前沿技术的研发,基于此前在 AI 大模型、机器学习算法以及 NLP 等领域的技术储备,将进一步开展前沿研究及应用探索。」
相关技术储备包括「混元」系列 AI 大模型、智能创作助手文涌(Effidit)等。
其中,混元 AI 大模型完整覆盖 NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业 / 领域模型。「文涌」的实现融合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索等技术,具有智能纠错、文本补全、文本润色等功能,部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型。
去年,混元 AI 大模型团队推出了万亿级别中文 NLP 预训练模型 HunYuan-NLP-1T,该模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。随着 AIGC 兴起,未来混元 AI 大模型会不断推进在文本内容生成、文生图等领域的持续升级。
相关阅读:
字节跳动:当前不做过多回应
2 月 9 日,有传闻称,字节跳动的人工智能实验室(AI Lab 有开展类似 ChatGPT 和 AIGC 的相关研发,未来或为旗下 PICO 提供技术支持。
但随后,PICO 相关负责人否认了传闻,说消息不实,PICO 目前没有采用类似 ChatGPT 技术的产品规划。
机器之心就相关问题询问字节跳动,字节表示当前不做过多回应。
在 AIGC 方向,字节跳动的研究成果包括非自回归模型 DA-Transformer、端到端语音到文本翻译模型 ConST、多颗粒度的视觉语言模型 X-VLM、图片和文本统一生成模型 DaVinci 等。其中 DA-Transformer 在机器翻译上首次达到了 Transformer 同样的精度,而处理的速度提高了 7~14 倍。DA-Transformer 不仅可以用于机器翻译,而且可以用于任意的序列到序列任务。
相关阅读:《字节跳动李航:人工智能需要新的范式和理论》
阿里巴巴:确实在研发中
关于阿里巴巴入局 ChatGPT 的传闻始于一张截图。该图显示,阿里巴巴可能将 AI 大模型技术与钉钉生产力工具深度结合。对此,阿里巴巴称,「确实在研发中,目前处于内测阶段,后续如有更多信息,会第一时间和大众同步。」
这一展示是阿里巴巴过去几年在大模型领域持续布局的成果。
2021 年初,阿里巴巴达摩院提出了百亿参数的超大规模中文多模态预训练模型 M6,并持续推出多个版本,参数逐步从百亿规模扩展到十万亿规模,在大模型、绿色 / 低碳 AI、AI 商业化、服务化等诸多方面取得突破性进展。
2022 年,在探索算力极限的同时,他们也积极展开了针对通用模型的探索,提出业界首个通用的统一大模型(模态、任务和架构)M6-OFA,极大地降低了模型在预训练、适配下游任务、推理过程中的难度。这个大模型是达摩院公布的阿里巴巴「通义」大模型系列的一部分。该系列分为三个层级:最底层为统一模型底座,中间基于底座的通用模型层覆盖了通义 - M6、通义 - AliceMind 和通义 - 视觉,专业模型层深入电商、医疗、娱乐、设计、金融等行业。