如何用MongoDB Atlas和大语言模型,高效构建企业级AI应用?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 利用生成式 AI 强化应用程序为客户打造令人叹服、真正差异化的体验意味着将人工智能建立在事实的基础之上

利用生成式 AI 强化应用程序为客户打造令人叹服、真正差异化的体验意味着将人工智能建立在事实的基础之上。这种事实来自于您的数据,更具体地说,来自于您最新的操作数据。

无论您是提供具有高级语义搜索的高度个性化体验,还是生成用户提示的内容和对话,MongoDB Atlas 都可以统一操作、分析和向量搜索数据服务,以简化将大语言模型 (LLM) 和转换器模型的强大功能嵌入到您的应用程序中。

开发者每天都在构建下一代具有突破性和变革性的采用生成式 AI 技术的应用程序。商业 LLM 和开源 LLM 正在以惊人的速度发展。围绕它们构建的框架和工具数不胜数,创新也变得大众化了。然而,开发团队必须跨越鸿沟,将这些应用程序从原型转变为企业就绪。

首先,这些大型模型提供的答案可能不正确或信息依据不足,因为它们访问的数据过时了。解决答案信息依据不足的问题有两种方法:优化大型模型或为其提供长期记忆。但是,这样做会产生第二个障碍,在采取了正确的安全控制措施的情况下,以用户期望的规模和性能围绕有信息依据的 LLM 部署应用程序。

开发者需要使用具有灵活数据模型的数据平台,以适应不断变化的非结构化和结构化数据,以便为大型模型提供信息,而不会受限于僵化的模式。

虽然优化模型是一种方法,但在时间和计算资源方面成本过高。这意味着开发者需要能够将数据作为提示的上下文呈现给大型模型。他们需要为这些生成式模型提供长期记忆。

下面我们将讨论一些示例,说明如何使用各种 LLM 和生成式 AI 框架实现这一点。

点击链接查看我们的 AI 资源页面,详细了解有关使用 MongoDB 构建采用 AI 技术的应用。

开始使用 MongoDB Atlas和大语言模型的五个资源

MongoDB Atlas 可以无缝集成领先的生成式 AI 服务和系统,如超大规模服务提供商和开源 LLM 及框架。通过 Atlas 数据库和 Atlas Vector Search将文档和向量嵌入数据存储结合使用,开发者可以加速构建基于真实操作数据的生成式 AI 强化应用程序。

以下是如何使用热门的 LLM 框架和 MongoDB 的示例:

开始使用Atlas Vector Search 和 OpenAI 进行语义搜索

本教程将引导您完成使用 MongoDB Atlas 对示例电影数据集执行语义搜索的步骤。首先,您将设置 Atlas Trigger,以便在将新文档插入集群时调用 OpenAI API,从而将其转换为向量嵌入。然后,您将使用 Atlas Vector Search 执行向量搜索查询。甚至还有一个特殊的奖励部分:利用 HuggingFace 模型。
image.png

阅读教程:https://www.mongodb.com/developer/products/atlas/semantic-search-mongodb-atlas-vector-search/

借助Llamalndex和MongoDB,使用您的专有数据构建生成式 AI 强化聊天应用

LlamaIndex 提供的简单而灵活的接口可以连接 LLM 与外部数据。这篇由 LlamaIndex 和 MongoDB 联合撰写的博客详细介绍了为什么以及如何构建自己的聊天应用。博客中附带的 notebook 提供了有关如何使用英语语言查询来查询任何 PDF 文档的代码演练。
image.png

阅读博客:https://medium.com/llamaindex-blog/build-a-chatgpt-with-your-private-data-using-llamaindex-and-mongodb-b09850eb154c

了解如何将 Atlas Vector Search 用作 LangChain 的向量存储

正如合作伙伴关系公告博客文章中所述,LangChain 和 MongoDB Atlas 实属天作之合,有机社区所表现出的热情证明了这一点,促成了 LangChain 中针对 MongoDB 的多次集成。除了现在支持 Atlas Vector Search 作为向量存储之外,还已经支持将 MongoDB 用作聊天日志历史记录。
image.png

网址阅读博客:https://js.langchain.com/docs/integrations/vectorstores/mongodb_atlas/

使用 MindsDB AI 集合直接在 MongoDB Atlas 中生成预测

MindsDB 是一个开源机器学习平台,它将自动机器学习引入数据库中。在此博客中,您将使用 MindsDB AI 集合直接在 Atlas 中生成预测,这样您就能够将预测数据用作常规数据来消费使用,查询这些预测数据,并通过简化部署工作流程来加快开发速度。

通过Atlas Triggers 将 HuggingFace 转换器模型集成到 MongoDB Atlas 中

HuggingFace 是一个 AI 社区,可以轻松构建、训练和部署机器学习模型。利用 Atlas Triggers 以及 HuggingFace,您可以轻松地应对操作数据的变化,这些数据为您的模型提供了长期记忆。了解如何设置 Triggers 以自动预测 MongoDB 数据库中新文档的情感信息,并将其作为附加字段添加到您的文档中。
image.png

阅读博客:https://github.com/philschmid/huggingface-mongodb-example

示例应用架构显示了外部或专有数据如何为 LLM 提供长期记忆,以及数据如何从用户的输入流向由 LLM 提供支持的响应。

使用 MongoDB 为生成式 AI 强化应用实现从原型到生产

MongoDB 基于 Atlas 构建的开发者数据平台可提供经过优化的现代化开发者体验,同时也经过全球数千家企业的实战测试,能够大规模、安全地运行。

无论您是在初创公司还是企业中构建下一个重大应用,Atlas 都可以让您:

● 加快构建基于真实的操作数据事实的生成式 AI 强化应用程序。
● 通过使用单个平台简化您的应用架构,该平台支持将应用和向量数据存储在同一位置,使用无服务器功能应对源数据的变化,并在多种数据模式中进行搜索,从而提高应用生成的响应的相关性和准确性。
● 凭借文档模型的灵活性,轻松开发生成式 AI 强化应用,同时维持简单、优质的开发者体验。
● 无缝集成领先的 AI 服务和系统(如超大规模服务提供商和开源 LLM 及框架),以在动态市场中保持竞争力。
● 在高性能、高度可扩展的操作数据库上构建生成式 AI 强化应用程序,该数据库在各种 AI 用例中经过了十年的验证。

虽然以上示例是构建更创新的应用所需的构建基块,但 MongoDB 可以帮助您实现从概念到生产再到扩展。

扫码加入钉群,与MongoDB专家一对一沟通,了解更多阿里云MongoDB产品与方案,市场活动及线上培训等内容。
4D23CF4C-EABF-40B3-80BE-5E4EDE071C42.png

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
19天前
|
人工智能 数据挖掘
🔔阿里云百炼智能体和工作流可以发布为组件了,AI应用变成“搭积木”
本文介绍了如何通过智能体组件化设计快速生成PPT。首先,创建一个“PPT大纲生成”智能体并发布为组件,该组件可根据用户输入生成结构清晰的大纲。接着,在新的智能体应用中调用此组件与MCP服务(如ChatPPT),实现从大纲到完整PPT的自动化生成。整个流程模块化、复用性强,显著降低AI开发门槛,提升效率。非技术人员也可轻松上手,满足多样化场景需求。
🔔阿里云百炼智能体和工作流可以发布为组件了,AI应用变成“搭积木”
|
19天前
|
数据采集 机器学习/深度学习 人工智能
代理IP:企业AI应用的隐形加速器与合规绞索
代理IP作为企业AI应用的重要基础设施,既是效率提升的加速器,也可能成为合规风险的来源。它通过技术演进重塑数据采集、模型训练与安全防护等核心环节,如智能路由、量子加密和边缘计算等创新方案显著优化性能。然而,全球法规(如GDPR)对数据流动提出严格要求,促使企业开发自动化合规审计系统应对挑战。未来,代理IP将向智能路由3.0、PaaS服务及量子网络方向发展,成为连接物理与数字世界的神经网络。企业在享受其带来的效率增益同时,需构建技术、法律与伦理三位一体的防护体系以规避风险。
42 0
|
20天前
|
传感器 人工智能 自动驾驶
生成式AI应用于自动驾驶:前沿与机遇
近期发表的一篇综述性论文总结了生成式AI在自动驾驶领域的应用进展,并探讨了自动驾驶与机器人、无人机等其它智能系统在生成式AI技术上的交叉融合趋势
65 10
|
10天前
|
人工智能 安全 网络安全
网络安全厂商F5推出AI Gateway,化解大模型应用风险
网络安全厂商F5推出AI Gateway,化解大模型应用风险
22 0
|
2月前
|
NoSQL MongoDB 数据库
数据库数据恢复——MongoDB数据库服务无法启动的数据恢复案例
MongoDB数据库数据恢复环境: 一台Windows Server操作系统虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 管理员在未关闭MongoDB服务的情况下拷贝数据库文件。将MongoDB数据库文件拷贝到其他分区后,对MongoDB数据库所在原分区进行了格式化操作。格式化完成后将数据库文件拷回原分区,并重新启动MongoDB服务。发现服务无法启动并报错。
|
3月前
|
存储 NoSQL MongoDB
微服务——MongoDB常用命令1——数据库操作
本节介绍了 MongoDB 中数据库的选择、创建与删除操作。使用 `use 数据库名称` 可选择或创建数据库,若数据库不存在则自动创建。通过 `show dbs` 或 `show databases` 查看所有可访问的数据库,用 `db` 命令查看当前数据库。注意,集合仅在插入数据后才会真正创建。数据库命名需遵循 UTF-8 格式,避免特殊字符,长度不超过 64 字节,且部分名称如 `admin`、`local` 和 `config` 为系统保留。删除数据库可通过 `db.dropDatabase()` 实现,主要用于移除已持久化的数据库。
125 0
|
3月前
|
存储 NoSQL MongoDB
从 MongoDB 到 时序数据库 TDengine,沃太能源实现 18 倍写入性能提升
沃太能源是国内领先储能设备生产厂商,数十万储能终端遍布世界各地。此前使用 MongoDB 存储时序数据,但随着设备测点增加,MongoDB 在存储效率、写入性能、查询性能等方面暴露出短板。经过对比,沃太能源选择了专业时序数据库 TDengine,生产效能显著提升:整体上,数据压缩率超 10 倍、写入性能提升 18 倍,查询在特定场景上也实现了数倍的提升。同时减少了技术架构复杂度,实现了零代码数据接入。本文将对 TDengine 在沃太能源的应用情况进行详解。
133 0
|
4月前
|
存储 NoSQL MongoDB
数据库数据恢复—MongoDB数据库迁移过程中丢失文件的数据恢复案例
某单位一台MongoDB数据库由于业务需求进行了数据迁移,数据库迁移后提示:“Windows无法启动MongoDB服务(位于 本地计算机 上)错误1067:进程意外终止。”
|
6月前
|
存储 JSON NoSQL
学习 MongoDB:打开强大的数据库技术大门
MongoDB 是一个基于分布式文件存储的文档数据库,由 C++ 编写,旨在为 Web 应用提供可扩展的高性能数据存储解决方案。它与 MySQL 类似,但使用文档结构而非表结构。核心概念包括:数据库(Database)、集合(Collection)、文档(Document)和字段(Field)。MongoDB 使用 BSON 格式存储数据,支持多种数据类型,如字符串、整数、数组等,并通过二进制编码实现高效存储和传输。BSON 文档结构类似 JSON,但更紧凑,适合网络传输。
134 15
|
6月前
|
存储 NoSQL 关系型数据库
阿里云数据库MongoDB版助力信也科技 打造互联网金融企业样板
我们的风控系统引入阿里云数据库MongoDB版后,解决了特征类字段灵活加减的问题,大大提高了开发效率,极大的提升了业务用户体验,获得了非常好的效果
阿里云数据库MongoDB版助力信也科技 打造互联网金融企业样板

推荐镜像

更多