白皮书推荐:借助MongoDB将生成式AI和高级搜索嵌入您的应用程序

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 加群领取白皮书

以前从未有哪一项新技术的推出会如此迅速地吸引企业、政府和消费者的关注。2022 年 11 月,ChatGPT 的面世展示了由大语言模型 (LLM) 提供支持的生成式 AI在解决大量新用例方面的潜力。

现在,似乎只需几个精心设计的提示,即可自动完成一系列工作,生成专业品质的文本、图像、音频、视频和编程代码,为客户提供更出色的支持。应用范围囊括气候变化建模、发现新药、设计新材料、预测金融市场走势...以及其他诸多方面。

“如何利用生成式 AI 颠覆市场,同时自己又不被颠覆?”——快速上升为企业、政府等的一个首要和关键问题。

本文内容摘录自《利用 MongoDB 在应用程序中嵌入生成式人工智能和高级搜索》,若需获取白皮书原版pdf,请见文末获取方式。

您的数据:打造具有独家竞争力GenAI模型的核心要素

当所有其他竞争对手都可以利用生成式人工智能时,您如果要想建立差异化优势,就必须用自己管理有序的数据来增强底层大语言模型 (LLM)。换句话说,您所具备的与众不同的“超能力”差异来自于允许这些模型访问您所拥有的意义非凡的企业资产——您的数据。

同时,技术领导者也很快意识到,GenAI 除了能提供潜在好处外,现阶段的不成熟也会带来风险。他们不能就这样丢弃多年来摸索出的最佳运营实践和制度化知识。相反,他们需要确保现有系统以及正在开发的新应用程序都能够以安全、可靠和准确的方式利用生成式 AI。您需要考虑如何在适当的安全控制下打造 AI 赋能的应用程序,同时达到用户期望的可扩展性和性能水平。
在本白皮书中,我们将讨论 MongoDB 如何助您实现这些目标,同时使用您自己的数据助力提供令人信服的新 GenAI 驱动的应用程序和体验。

向量搜索和LLM工作流程

为了将自己的数据馈送到 AI 模型中,我们需要先将其转换为向量嵌入。本白皮书中将会介绍向量嵌入与向量搜索的优势和用途,例如可嵌入非结构化数据、从“关键词搜索”到“上下文感知语义搜索”的升级等;同时还将介绍LLM执行检索增强生成(Retrieval-Augmented Generation,简称RAG)的工作流程。
image.png

将自定义数据与 LLM 动态结合以生成可靠的相关输出

开发者数据平台:构建智能应用程序的更好选择

向量存储虽至关重要,却只是应用程序,或AI生态系统的一部分,还必须能够管理非向量化的常规业务数据(如客户记录、订单和库存、交易和事务、报价、地理空间坐标、社交媒体动态...等等)所有这些数据都需要进行查询才能为应用程序功能提供强大支持。

此外,我们还需要执行一些非功能性操作——例如满足正常运行时间、性能和可扩展性SLA 的要求、集成新功能、保护和备份数据,以及审核数据...

然而将各种技术结合使用以增强新的 AI驱动体验,并将其整合到您的应用程序中,则会导致增加大量单点产品且复杂性攀升,给您的团队带来巨大开销、降低开发者的效率、并可能减缓应用落地的速度等。

image.png

因此,使用基于 MongoDB Atlas 构建的开发者数据平台是一种更好的选择。开发者数据平台统一了操作、分析和生成式 AI 数据服务,可简化构建智能应用程序的过程。从原型到生产,借助 Atlas,您可以确保自己的应用程序基于真实的最新操作数据事实,同时满足用户期望的规模、安全性和性能。Atlas的灵活文档数据模型以及开发者原生查询 API,帮助开发者能够显著加快创新速度,抓住生成式AI 带来的新市场机遇。

image.png

MongoDB Atlas 集成了将 AI 引入应用程序所需的数据服务

3个热门用例:如何利用 MongoDB Atlas 构建AI强化应用?

● 客户自助式聊天机器人和问答
● 高级电子商务搜索和建议
● 富媒体(多模式)分析和生成

这三个示例都依赖于生成式 AI 和高级语义搜索,可打造令人惊艳的用户体验,并解锁以前大多数组织所无法触及的功能。

在本白皮书中,我们将依次介绍每个使用案例,展示架构设计模式以及每位开发者利用人工智能和高级搜索所需的基本功能。

image.png
image.png

白皮书截图

MongoDB Vector Search的实际应用

MongoDB 旗下产品已广泛用于传统的 AI 用例。
● Continental 选择将 MongoDB 用作其 Vision Zero 自动驾驶计划中的特征工程平台。
● 博世和西班牙电信均在其 AI 增强的物联网平台中使用MongoDB。
● Kronos 使用 MongoDB 中的数据来配置和构建机器学习模型,每天交易的加密货币达到数十亿美元。
● Iguazio 使用 MongoDB 作为其数据科学和 MLOps 平台的持久层。
● H2O.ai 和 Featureform 支持 MongoDB 作为其各自平台中的功能存储。

在此基础上,MongoDB Atlas 如今已用于各种应用程序,不断突破 GenAI 的可能性。我们的案例包括:
● Ada:帮助 Meta、ATT 和 Verizon 等公司通过 AI 驱动的自动化和会话 AI 更好地为客户提供支持。
● ExTrac:通过分析实时数据流,识别潜在的人身伤害危险和数字风险并对这些风险分类。
● Eni:提供地质数据并将其变为可操作数据,从而更好地制定决策,帮助公司加快实现净零排放。
● Inovaare:在整个医疗保健生命周期中对数据进行持续监控、提取和分类,以进行监管合规性报告、审计和风险评估。
● Source Digital:在将其视频检测平台从 PostgreSQL 迁移到 MongoDB Atlas 后,成本降低了 7 倍。
● Catylex:对合同条款进行自动提取、分类和分析,以确定权利、义务和风险。
● Robust Intelligence:通过其 AI 防火墙产品实时验证输入和输出,保护投入使用的大语言模型 (LLM)。
● Potion:使用自定义视觉和音频模型重新生成视频和音频流。

软件工具供应商 Retool 的 AI 现状调查反映了 MongoDB 在 AI 开发者中的受欢迎程度,该调查得出结论,MongoDB Atlas Vector Search:

  1. 在考察的所有向量数据库中,此 MongoDB 数据库的净推荐值 (NPS) 最高。
  2. 在产品发布后的几个月内,便已一跃成为应用范围第二广泛的向量数据库,领先于已经上市多年的替代解决方案。

无论您是在初创公司还是企业中构建下一个重大应用,借助 MongoDB Atlas,您可以:

● 加快构建基于真实的操作数据事实的生成式 AI 强化应用程序。
● 通过使用单个平台来简化技术堆栈,该平台允许您的应用将操作数据和向量嵌入存储在同一位置,使用无服务器功能对源数据的变化做出反应,并在多种数据形式之间进行搜索,从而提高应用生成的响应的相关性和准确性。
● 凭借文档模型的灵活性,轻松开发生成式 AI 强化应用,同时维持简单、优质的开发者体验。
● 无缝集成领先的 AI 服务和系统(如超大规模服务提供商和开源 LLM 及框架),以在动态市场中保持竞争力。
● 在高性能、高度可扩展的操作数据库上构建 GenAI 强化应用程序,该数据库在各种 AI 用例中经过了十年的验证。

扫码加入钉群,领取白皮书。与MongoDB专家一对一沟通,了解更多阿里云MongoDB产品与方案,市场活动及线上培训等内容。
4D23CF4C-EABF-40B3-80BE-5E4EDE071C42.png

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
【AI】生成式AI,对话式AI,LLM,SLM 差异分析
【5月更文挑战第6天】生成式AI,对话式AI,LLM,SLM 学习
|
3天前
|
人工智能 自然语言处理 数据库
【AI 生成式】大语言模型(LLM)有哪些典型的应用场景?
【5月更文挑战第5天】【AI 生成式】大语言模型(LLM)有哪些典型的应用场景?
|
3天前
|
数据采集 机器学习/深度学习 人工智能
【AI 生成式】LLM 通常如何训练?
【5月更文挑战第5天】【AI 生成式】LLM 通常如何训练?
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
【大模型】什么是大型语言模型(LLM)?
【5月更文挑战第4天】【大模型】什么是大型语言模型(LLM)?
|
4天前
|
机器学习/深度学习 人工智能 数据挖掘
【AI 生成式】半监督学习和自监督学习的概念
【5月更文挑战第4天】【AI 生成式】半监督学习和自监督学习的概念
|
4天前
|
人工智能 搜索推荐 安全
【AI 生成式】生成式人工智能在内容创作和版权方面有何影响?
【5月更文挑战第4天】【AI 生成式】生成式人工智能在内容创作和版权方面有何影响?
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】生成式人工智能如何在虚拟现实和游戏中使用?
【5月更文挑战第4天】【AI 生成式】生成式人工智能如何在虚拟现实和游戏中使用?
|
4天前
|
人工智能 搜索推荐
【AI 生成式】描述生成式 AI 在医疗保健和药物发现中的应用
【5月更文挑战第4天】【AI 生成式】描述生成式 AI 在医疗保健和药物发现中的应用
|
4天前
|
人工智能 自然语言处理 算法
【AI 生成式】生成式人工智能未来有哪些潜在的进步?
【5月更文挑战第4天】【AI 生成式】生成式人工智能未来有哪些潜在的进步?
|
4天前
|
机器学习/深度学习 数据采集 人工智能
【AI 生成式】生成式 AI 中变分自动编码器 (VAE) 的概念
【5月更文挑战第4天】【AI 生成式】生成式 AI 中变分自动编码器 (VAE) 的概念