从「生成式AI」转化为「生产力」,亚马逊云科技划出重点

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
简介: 从「生成式AI」转化为「生产力」,亚马逊云科技划出重点


作者:蛋酱

十年来,人工智能一直是科技领域的热门主题。我们看到了高准确率的人脸识别系统、战胜人类顶级棋手的围棋 AI、预测蛋白质结构的 AI…… 这些技术进步都曾引起大众的震撼,也曾在各自的领域内被赋予「颠覆格局」的期待,但在通用能力上还不够理想。

直到这两年,预训练大模型技术使得 AI 的通用能力往前迈了一大步。几十亿、上百亿参数的模型不仅能够迅速处理海量信息,还能理解人类自然语言的输入、进行复杂的逻辑推理,并掌握了优秀的内容生成能力。AI 正在从特定任务的解决方案转向具有更广泛应用性的解决方案,或者说,有望大规模地创造价值。

比如,Stable Diffusion 背后的公司 Stability AI 推出了一项新的生成工具「Stable Doodle」。在这一工具的辅助下,从寥寥几笔的草图到生成品质不输专业画师的原创插画,不过几秒钟的时间:


一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式 AI 每年可能为全球经济增加 2.6 万亿到 4.4 万亿美元的价值。

在几天前的亚马逊云科技纽约峰会中,「生成式 AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁 Swami Sivasubramanian 表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

亚马逊云科技数据库、数据分析和机器学习全球副总裁 Swami Sivasubramanian 在亚马逊云科技纽约峰会上发表主旨演讲。

那么,对于广阔的各行各业,这种 AI 带来的生产力变革究竟是如何一步步发生的?

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的 AI 能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式 AI 新功能。

最强的生成式 AI 大模型,在这里轻松调用

半年来,大模型之战如火如荼。当 OpenAI 和谷歌你追我赶,迅速崛起的「开源」力量也不容小觑。可以预见的是,在未来的大模型竞争格局中,「没有一个模型可以统治一切」。

在 ChatGPT 发布两个月后,Anthropic 公司就迅速开发出了「最强竞品」 Claude,又在 7 月初完成了 Claude 2 的升级。被称为是「AI 社区内最强大的开源大模型」的 LLaMa,在不久前也升级为 LLaMa 2,不断抬高开源大模型的能力上限。

正像一些业内人士所说,任何一家闭源的大模型提供商都没有护城河。不管是 LLaMa 还是 Claude,开源大模型都显示出了迭代速度更快、可定制性更强、更具私密性的优势。

而这些开源大模型的力量,正在越来越多地汇聚于亚马逊云科技的服务之中。

今年 4 月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。

Amazon Bedrock 的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的 AI 算力和工具,再结合自己的数据开始构建生成式 AI 应用。

在最新扩展后的 Amazon Bedrock 中,汇聚了来自一批顶级大模型供应商的最新成果:

目前,Amazon Bedrock 提供了 Anthropic 最新语言模型 Claude 2、AI21 的 JURASSIC-2、亚马逊自研的 Amazon Titan 系列模型的访问。Stability AI 也在 Amazon Bedrock 中首发了最新版的文生图模型套件 Stable Diffusion XL 1.0。此外,Cohere 成为了最新加入 Amazon Bedrock 的基础模型供应商,并带来了文本生成模型 Command 和文本理解模型 EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock 的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在 Amazon S3 对象存储服务中的数据,并能够从 亚马逊云科技访问控制和治理策略中受益。

生成式 AI 让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同 Amazon Bedrock 这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式 AI,撬动了一个全新的蓝海市场。

推动生成式 AI 走完落地的「最后一公里」

在今天,即使生成式 AI 模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。

比如一位顾客想咨询换货,电商平台的 AI 客服当然可以迅速地告知顾客想要的款式、尺码、颜色是否还有库存,但无法完成接下来的订单更新或交易管理的操作。

这恰恰是「生成式 AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加 API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如 ChatGPT 此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。

为了简化这一环节所需的工作,亚马逊云科技正式推出了 Amazon Bedrock Agents。

Amazon Bedrock Agents 可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的 Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式 AI 应用程序,推动解决生成式 AI 落地的「最后一公里」问题。比如,企业可以使用 Amazon Bedrock Agents 创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents 就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

生成式 AI 时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式 AI 时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

与向量数据库的结合,让大模型的综合实力增色不少。此外,向量数据库为任何希望接入大模型的企业用户提供了一种规避核心数据泄露问题的方法。

可以说,向量数据库会成为未来大模型研发、落地必不可少的基础设施之一。

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括 Amazon Aurora PostgreSQL 兼容版关系型数据库,兼容 PostgreSQL 的 Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于 Amazon OpenSearch Serverless 的向量引擎。该向量引擎支持简单的 API 调用,可用于存储和查询数十亿个 Embeddings。

该引擎由 Amazon OpenSearch 项目中的 k 最近邻 (kNN) 搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

让生成式 AI 落地多重加速

在这些重磅发布之外,为了加速生成式 AI 的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:

其中一项服务是关于计算基础设施,基于英伟达 H100 Tensor Core GPU 的 Amazon EC2 P5 实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

很多业界知名的生成式 AI 模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式 AI 落地速度的因素之一。

与上一代基于 GPU 的实例相比,Amazon EC2 P5 实例使得训练最高提速 6 倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达 40% 的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了 AI 编程助手 Amazon CodeWhisperer 预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快 57%。

现在,Amazon CodeWhisperer 已经正式可用,并且实现了与 Amazon Glue 的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhisperer 会直接在 Amazon Glue Notebooks 中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。

也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

今天,生成式 AI 已经能够给出与人类创作无法区分的内容,处理此前 AI 并不擅长的知识性工作和创造性工作。行业的壁垒在某种程度上被打破、重构,一场由生成式 AI 引发的生产力革命正在发生。

通用人工智能(AGI)是否真能实现?想必现在,已经不会有人再站出来表示质疑。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去 20 年在人工智能技术上的深厚积累,在于对于超过 10 万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式 AI 落地的征程,帮助到每一位开发者或创业团队。

我们能看到的是,在一系列面向生成式 AI 的基础设施和开发工具源源不断投入应用之后,大模型落地的门槛被打了下来,开始走向各行各业的深处。

这场生产力革命,显然已经在加速了。

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
22天前
|
人工智能 算法 搜索推荐
首个AI编程助手入职科技公司:探索与应用新技术
随着人工智能技术的不断进步和应用,AI编程助手作为其中的一项创新成果,正逐渐走进科技公司的开发环节。就在近日,通义灵码作为首个AI编程助手入职阿里云,为开发人员提供全流程的代码辅助服务。这一新技术的引入引发了广泛关注,这一新技术的引入,既带来了便利和效率的提升,也引发了人们对于人机协作、智能辅助的思考。因为传统的开发模式下,程序员们需要不断投入大量的时间和精力来编写、调试和优化代码,这使得大家在核心业务代码编写方面面临着时间压力,但是随着AI编程助手的加入,情况发生了很大变化。那么本文就来探讨如何看待首个AI编程助手入职科技公司,并分享个人对通义灵码的使用感受。
40 2
首个AI编程助手入职科技公司:探索与应用新技术
|
2月前
|
人工智能 运维 安全
英伟达发布AI Enterprise 5.0,帮助企业加速生成式AI开发
英伟达发布AI Enterprise 5.0,这是一个云端原生平台,加速生成式AI的开发与部署。该平台提供优化的数据科学流程,支持生成式AI,强调性能、安全性和灵活性。核心特性包括NVIDIA NIM和CUDA-X微服务的性能优化,严格的安全监测,多环境运行能力,及企业级支持与服务。API目录提供多种预训练模型,促进跨领域的应用创新。然而,平台可能对小企业有高技术门槛和成本挑战,且可能存在与现有系统兼容性问题。
24 1
英伟达发布AI Enterprise 5.0,帮助企业加速生成式AI开发
|
2月前
|
人工智能 自然语言处理 数据处理
英伟达推出NeMo,极大简化自定义生成式AI开发
【2月更文挑战第30天】英伟达发布NeMo平台,简化生成式AI模型开发,加速AIGC进程。平台提供NeMo Curator、Customizer和Evaluator微服务,覆盖数据准备至模型评估全周期。Curator加速数据处理,Customizer支持模型微调,Evaluator全面评估模型性能。虽有学习曲线挑战,但NeMo为AI创新与应用带来更多可能性。
48 2
英伟达推出NeMo,极大简化自定义生成式AI开发
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
2024年AI辅助研发:科技创新的引擎
2024年AI辅助研发:科技创新的引擎
47 1
|
7天前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
破壁人AI百度:科技公司反内卷的典型样本
13 0
|
8天前
|
人工智能 NoSQL atlas
生成式AI入门必读:基本概念、数据挑战与解决方案
为了实现这一目标,许多企业正在选择MongoDB Atlas
|
8天前
|
人工智能 NoSQL 安全
MongoDB观点:让生成式AI成为业务增长的新动能,游戏公司可以这样做
生成式AI技术将深刻地改变人们的生活和企业运营方式
|
17天前
|
机器学习/深度学习 编解码 人工智能
Transformer 和扩散模型的生成式 AI 实用指南(预览版)
Transformer 和扩散模型的生成式 AI 实用指南(预览版)
34 1
Transformer 和扩散模型的生成式 AI 实用指南(预览版)
|
25天前
|
传感器 人工智能 安全
AI日报:一个新的“科技超级周期”正在出现
AI日报:一个新的“科技超级周期”正在出现
13 0
|
25天前
|
人工智能 安全 数据库
AI日报:这种病毒从生成式AI工具中窃取您的数据
AI日报:这种病毒从生成式AI工具中窃取您的数据
17 0
AI日报:这种病毒从生成式AI工具中窃取您的数据