从「生成式AI」转化为「生产力」,亚马逊云科技划出重点

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: 从「生成式AI」转化为「生产力」,亚马逊云科技划出重点


作者:蛋酱

十年来,人工智能一直是科技领域的热门主题。我们看到了高准确率的人脸识别系统、战胜人类顶级棋手的围棋 AI、预测蛋白质结构的 AI…… 这些技术进步都曾引起大众的震撼,也曾在各自的领域内被赋予「颠覆格局」的期待,但在通用能力上还不够理想。

直到这两年,预训练大模型技术使得 AI 的通用能力往前迈了一大步。几十亿、上百亿参数的模型不仅能够迅速处理海量信息,还能理解人类自然语言的输入、进行复杂的逻辑推理,并掌握了优秀的内容生成能力。AI 正在从特定任务的解决方案转向具有更广泛应用性的解决方案,或者说,有望大规模地创造价值。

比如,Stable Diffusion 背后的公司 Stability AI 推出了一项新的生成工具「Stable Doodle」。在这一工具的辅助下,从寥寥几笔的草图到生成品质不输专业画师的原创插画,不过几秒钟的时间:


一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式 AI 每年可能为全球经济增加 2.6 万亿到 4.4 万亿美元的价值。

在几天前的亚马逊云科技纽约峰会中,「生成式 AI」同样是全场提及频率最高的关键词。

「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁 Swami Sivasubramanian 表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」

亚马逊云科技数据库、数据分析和机器学习全球副总裁 Swami Sivasubramanian 在亚马逊云科技纽约峰会上发表主旨演讲。

那么,对于广阔的各行各业,这种 AI 带来的生产力变革究竟是如何一步步发生的?

凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的 AI 能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式 AI 新功能。

最强的生成式 AI 大模型,在这里轻松调用

半年来,大模型之战如火如荼。当 OpenAI 和谷歌你追我赶,迅速崛起的「开源」力量也不容小觑。可以预见的是,在未来的大模型竞争格局中,「没有一个模型可以统治一切」。

在 ChatGPT 发布两个月后,Anthropic 公司就迅速开发出了「最强竞品」 Claude,又在 7 月初完成了 Claude 2 的升级。被称为是「AI 社区内最强大的开源大模型」的 LLaMa,在不久前也升级为 LLaMa 2,不断抬高开源大模型的能力上限。

正像一些业内人士所说,任何一家闭源的大模型提供商都没有护城河。不管是 LLaMa 还是 Claude,开源大模型都显示出了迭代速度更快、可定制性更强、更具私密性的优势。

而这些开源大模型的力量,正在越来越多地汇聚于亚马逊云科技的服务之中。

今年 4 月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。

从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。

Amazon Bedrock 的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的 AI 算力和工具,再结合自己的数据开始构建生成式 AI 应用。

在最新扩展后的 Amazon Bedrock 中,汇聚了来自一批顶级大模型供应商的最新成果:

目前,Amazon Bedrock 提供了 Anthropic 最新语言模型 Claude 2、AI21 的 JURASSIC-2、亚马逊自研的 Amazon Titan 系列模型的访问。Stability AI 也在 Amazon Bedrock 中首发了最新版的文生图模型套件 Stable Diffusion XL 1.0。此外,Cohere 成为了最新加入 Amazon Bedrock 的基础模型供应商,并带来了文本生成模型 Command 和文本理解模型 EMBED。

相比于其他的一站式的大模型服务平台,Amazon Bedrock 的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在 Amazon S3 对象存储服务中的数据,并能够从 亚马逊云科技访问控制和治理策略中受益。

生成式 AI 让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同 Amazon Bedrock 这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式 AI,撬动了一个全新的蓝海市场。

推动生成式 AI 走完落地的「最后一公里」

在今天,即使生成式 AI 模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。

比如一位顾客想咨询换货,电商平台的 AI 客服当然可以迅速地告知顾客想要的款式、尺码、颜色是否还有库存,但无法完成接下来的订单更新或交易管理的操作。

这恰恰是「生成式 AI」转化为「生产力」过程中非常关键的一步。

问题并非不能解决:模型通常可以附加 API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如 ChatGPT 此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。

为了简化这一环节所需的工作,亚马逊云科技正式推出了 Amazon Bedrock Agents。

Amazon Bedrock Agents 可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的 Agents:

该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式 AI 应用程序,推动解决生成式 AI 落地的「最后一公里」问题。比如,企业可以使用 Amazon Bedrock Agents 创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。

如果做个比喻的话,Amazon Bedrock Agents 就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。

生成式 AI 时代的搜索技术变革

在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式 AI 时代正在发生的变革。

首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。

其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。

与向量数据库的结合,让大模型的综合实力增色不少。此外,向量数据库为任何希望接入大模型的企业用户提供了一种规避核心数据泄露问题的方法。

可以说,向量数据库会成为未来大模型研发、落地必不可少的基础设施之一。

对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括 Amazon Aurora PostgreSQL 兼容版关系型数据库,兼容 PostgreSQL 的 Amazon RDS(Amazon Relational Database Service)关系型数据库等。

在这一次的峰会上,亚马逊云科技又推出了适用于 Amazon OpenSearch Serverless 的向量引擎。该向量引擎支持简单的 API 调用,可用于存储和查询数十亿个 Embeddings。

该引擎由 Amazon OpenSearch 项目中的 k 最近邻 (kNN) 搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。

顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。

让生成式 AI 落地多重加速

在这些重磅发布之外,为了加速生成式 AI 的训练和应用,亚马逊云科技已推出了一系列服务和工具。

最新动态是,两项关键服务已正式可用:

其中一项服务是关于计算基础设施,基于英伟达 H100 Tensor Core GPU 的 Amazon EC2 P5 实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。

很多业界知名的生成式 AI 模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式 AI 落地速度的因素之一。

与上一代基于 GPU 的实例相比,Amazon EC2 P5 实例使得训练最高提速 6 倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达 40% 的训练成本。

另外一项服务是有关于开发工具。去年,亚马逊云科技推出了 AI 编程助手 Amazon CodeWhisperer 预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快 57%。

现在,Amazon CodeWhisperer 已经正式可用,并且实现了与 Amazon Glue 的集成。

从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhisperer 会直接在 Amazon Glue Notebooks 中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。

也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。

写在最后

技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。

今天,生成式 AI 已经能够给出与人类创作无法区分的内容,处理此前 AI 并不擅长的知识性工作和创造性工作。行业的壁垒在某种程度上被打破、重构,一场由生成式 AI 引发的生产力革命正在发生。

通用人工智能(AGI)是否真能实现?想必现在,已经不会有人再站出来表示质疑。

在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去 20 年在人工智能技术上的深厚积累,在于对于超过 10 万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式 AI 落地的征程,帮助到每一位开发者或创业团队。

我们能看到的是,在一系列面向生成式 AI 的基础设施和开发工具源源不断投入应用之后,大模型落地的门槛被打了下来,开始走向各行各业的深处。

这场生产力革命,显然已经在加速了。

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
1月前
|
机器学习/深度学习 数据采集 人工智能
未来的守护神:AI驱动的网络安全之盾,如何用智慧的光芒驱散网络黑暗势力?揭秘高科技防御系统背后的惊天秘密!
【10月更文挑战第3天】随着网络技术的发展,网络安全问题日益严峻,传统防御手段已显不足。本文探讨了构建AI驱动的自适应网络安全防御系统的必要性及其关键环节:数据采集、行为分析、威胁识别、响应决策和执行。通过Python库(如scapy、scikit-learn和TensorFlow)的应用实例,展示了如何利用AI技术提升网络安全防护水平。这种系统能够实时监控、智能分析并自动化响应,显著提高防护效率与准确性,为数字世界提供更强大的安全保障。
60 2
|
7天前
|
人工智能 算法 新制造
走进北京科技大学,通义灵码与企业高校共筑 AI 创意课堂
近日,通义灵码有幸参与到一场由伊利集团主办的 AIGC 生态创新大赛路演舞台,与高校专家、企业代表、青年学子共同探讨 AIGC 创意应用,交流企业在数智领域转型、青年开发者科技创新的思路和落地实践。
|
1月前
|
机器学习/深度学习 人工智能 监控
AI与未来医疗:重塑健康产业的双刃剑随着科技的迅猛发展,人工智能(AI)正以前所未有的速度融入各行各业,其中医疗领域作为关系到人类生命健康的重要行业,自然也成为AI应用的焦点之一。本文将探讨AI在未来医疗中的潜力与挑战,分析其对健康产业可能带来的革命性变化。
在医疗领域,人工智能不仅仅是一种技术革新,更是一场关乎生死存亡的革命。从诊断到治疗,从后台数据分析到前端临床应用,AI正在全方位地改变传统医疗模式。然而,任何技术的发展都有其两面性,AI也不例外。本文通过深入分析,揭示AI在医疗领域的巨大潜力及其潜在风险,帮助读者更好地理解这一前沿技术对未来健康产业的影响。
|
3月前
|
人工智能 运维 自然语言处理
从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
【8月更文挑战第10天】从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
|
3月前
|
机器学习/深度学习 数据采集 人工智能
未来的守护神:AI驱动的网络安全之盾,如何用智慧的光芒驱散网络黑暗势力?揭秘高科技防御系统背后的惊天秘密!
【8月更文挑战第13天】随着网络技术的发展,网络安全问题愈发严峻,传统防御手段已显乏力。本文探讨构建AI驱动的自适应网络安全防御系统,该系统能自动调整策略应对未知威胁。通过数据采集、行为分析、威胁识别及响应决策等环节,利用Python工具如Scapy、scikit-learn和TensorFlow实现网络流量监控、异常检测及自动化响应,从而提升网络安全防护的效率和准确性。随着AI技术的进步,未来的网络安全防御将更加智能和自动化。
55 6
|
3月前
|
人工智能 Serverless
AI 创作风潮起:函数计算探索科技与艺术的无限可能
AI 创作风潮起:函数计算探索科技与艺术的无限可能。
|
4月前
|
人工智能 数据挖掘 Python
提升办公生产力工具——AI数据分析应用小浣熊
办公小浣熊广泛应用于日常数据分析、财务分析、商业分析、销售预测、市场分析等多个领域,为用户提供了强大的支持。
提升办公生产力工具——AI数据分析应用小浣熊
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
中国生成式AI专利38,000个,是美国6倍、超过全球总和!
【7月更文挑战第18天】中国在生成式AI专利上领先全球,申请量达38,000项,超美国6倍,占全球总数过半。WIPO报告指出,中国因政府大力投资AI研发而占据领先地位。GenAI技术虽带来创新,但也涉及伦理、隐私、就业及安全等问题。[查看报告](https://www.wipo.int/web-publications/patent-landscape-report-generative-artificial-intelligence-genai/index.html)**
78 2
|
4月前
|
人工智能 监控 安全
阿里云携手北京奇奇科技举办《AI智领者技术沙龙》
6月5日,一场主题为“通义大模型的创意与应用探索”的AI智领者技术沙龙在京召开。这场会议汇聚了行业内外众多专家及企业代表,主办方阿里云与北京奇奇科技和与会者共同探讨AI大模型如何从理论走向实践,从实验室迈向广阔的应用场景。
|
4月前
|
人工智能 机器人 数据挖掘
客户在哪儿AI与其他服务于B端的科技产品有何不同
客户在哪儿AI与市面上其他几类服务于B端的科技产品有什么不同

热门文章

最新文章