如何用MongoDB Atlas和大语言模型,高效构建企业级AI应用?

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 Tair(兼容Redis),内存型 2GB
简介: 利用生成式 AI 强化应用程序为客户打造令人叹服、真正差异化的体验意味着将人工智能建立在事实的基础之上

利用生成式 AI 强化应用程序为客户打造令人叹服、真正差异化的体验意味着将人工智能建立在事实的基础之上。这种事实来自于您的数据,更具体地说,来自于您最新的操作数据。

无论您是提供具有高级语义搜索的高度个性化体验,还是生成用户提示的内容和对话,MongoDB Atlas 都可以统一操作、分析和向量搜索数据服务,以简化将大语言模型 (LLM) 和转换器模型的强大功能嵌入到您的应用程序中。

开发者每天都在构建下一代具有突破性和变革性的采用生成式 AI 技术的应用程序。商业 LLM 和开源 LLM 正在以惊人的速度发展。围绕它们构建的框架和工具数不胜数,创新也变得大众化了。然而,开发团队必须跨越鸿沟,将这些应用程序从原型转变为企业就绪。

首先,这些大型模型提供的答案可能不正确或信息依据不足,因为它们访问的数据过时了。解决答案信息依据不足的问题有两种方法:优化大型模型或为其提供长期记忆。但是,这样做会产生第二个障碍,在采取了正确的安全控制措施的情况下,以用户期望的规模和性能围绕有信息依据的 LLM 部署应用程序。

开发者需要使用具有灵活数据模型的数据平台,以适应不断变化的非结构化和结构化数据,以便为大型模型提供信息,而不会受限于僵化的模式。

虽然优化模型是一种方法,但在时间和计算资源方面成本过高。这意味着开发者需要能够将数据作为提示的上下文呈现给大型模型。他们需要为这些生成式模型提供长期记忆。

下面我们将讨论一些示例,说明如何使用各种 LLM 和生成式 AI 框架实现这一点。

点击链接查看我们的 AI 资源页面,详细了解有关使用 MongoDB 构建采用 AI 技术的应用。

开始使用 MongoDB Atlas和大语言模型的五个资源

MongoDB Atlas 可以无缝集成领先的生成式 AI 服务和系统,如超大规模服务提供商和开源 LLM 及框架。通过 Atlas 数据库和 Atlas Vector Search将文档和向量嵌入数据存储结合使用,开发者可以加速构建基于真实操作数据的生成式 AI 强化应用程序。

以下是如何使用热门的 LLM 框架和 MongoDB 的示例:

开始使用Atlas Vector Search 和 OpenAI 进行语义搜索

本教程将引导您完成使用 MongoDB Atlas 对示例电影数据集执行语义搜索的步骤。首先,您将设置 Atlas Trigger,以便在将新文档插入集群时调用 OpenAI API,从而将其转换为向量嵌入。然后,您将使用 Atlas Vector Search 执行向量搜索查询。甚至还有一个特殊的奖励部分:利用 HuggingFace 模型。
image.png

阅读教程:https://www.mongodb.com/developer/products/atlas/semantic-search-mongodb-atlas-vector-search/

借助Llamalndex和MongoDB,使用您的专有数据构建生成式 AI 强化聊天应用

LlamaIndex 提供的简单而灵活的接口可以连接 LLM 与外部数据。这篇由 LlamaIndex 和 MongoDB 联合撰写的博客详细介绍了为什么以及如何构建自己的聊天应用。博客中附带的 notebook 提供了有关如何使用英语语言查询来查询任何 PDF 文档的代码演练。
image.png

阅读博客:https://medium.com/llamaindex-blog/build-a-chatgpt-with-your-private-data-using-llamaindex-and-mongodb-b09850eb154c

了解如何将 Atlas Vector Search 用作 LangChain 的向量存储

正如合作伙伴关系公告博客文章中所述,LangChain 和 MongoDB Atlas 实属天作之合,有机社区所表现出的热情证明了这一点,促成了 LangChain 中针对 MongoDB 的多次集成。除了现在支持 Atlas Vector Search 作为向量存储之外,还已经支持将 MongoDB 用作聊天日志历史记录。
image.png

网址阅读博客:https://js.langchain.com/docs/integrations/vectorstores/mongodb_atlas/

使用 MindsDB AI 集合直接在 MongoDB Atlas 中生成预测

MindsDB 是一个开源机器学习平台,它将自动机器学习引入数据库中。在此博客中,您将使用 MindsDB AI 集合直接在 Atlas 中生成预测,这样您就能够将预测数据用作常规数据来消费使用,查询这些预测数据,并通过简化部署工作流程来加快开发速度。

通过Atlas Triggers 将 HuggingFace 转换器模型集成到 MongoDB Atlas 中

HuggingFace 是一个 AI 社区,可以轻松构建、训练和部署机器学习模型。利用 Atlas Triggers 以及 HuggingFace,您可以轻松地应对操作数据的变化,这些数据为您的模型提供了长期记忆。了解如何设置 Triggers 以自动预测 MongoDB 数据库中新文档的情感信息,并将其作为附加字段添加到您的文档中。
image.png

阅读博客:https://github.com/philschmid/huggingface-mongodb-example

示例应用架构显示了外部或专有数据如何为 LLM 提供长期记忆,以及数据如何从用户的输入流向由 LLM 提供支持的响应。

使用 MongoDB 为生成式 AI 强化应用实现从原型到生产

MongoDB 基于 Atlas 构建的开发者数据平台可提供经过优化的现代化开发者体验,同时也经过全球数千家企业的实战测试,能够大规模、安全地运行。

无论您是在初创公司还是企业中构建下一个重大应用,Atlas 都可以让您:

● 加快构建基于真实的操作数据事实的生成式 AI 强化应用程序。
● 通过使用单个平台简化您的应用架构,该平台支持将应用和向量数据存储在同一位置,使用无服务器功能应对源数据的变化,并在多种数据模式中进行搜索,从而提高应用生成的响应的相关性和准确性。
● 凭借文档模型的灵活性,轻松开发生成式 AI 强化应用,同时维持简单、优质的开发者体验。
● 无缝集成领先的 AI 服务和系统(如超大规模服务提供商和开源 LLM 及框架),以在动态市场中保持竞争力。
● 在高性能、高度可扩展的操作数据库上构建生成式 AI 强化应用程序,该数据库在各种 AI 用例中经过了十年的验证。

虽然以上示例是构建更创新的应用所需的构建基块,但 MongoDB 可以帮助您实现从概念到生产再到扩展。

扫码加入钉群,与MongoDB专家一对一沟通,了解更多阿里云MongoDB产品与方案,市场活动及线上培训等内容。
4D23CF4C-EABF-40B3-80BE-5E4EDE071C42.png

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
Meta AI推出的Llama 3.3是一款70B参数的纯文本语言模型,支持多语言对话,具备高效、低成本的特点,适用于多种应用场景,如聊天机器人、客户服务自动化、语言翻译等。
67 13
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
|
3天前
|
存储 NoSQL atlas
探索MongoDB:发展历程、优势与应用场景
MongoDB 是一个开源的文档型数据库,由 DoubleClick 团队于2007年创立,旨在解决传统数据库的扩展性和灵活性问题。它支持 JSON 格式的存储和查询,具备高可用性、高扩展性和灵活性等优势。MongoDB 适用于社交、物联网、视频直播和内容管理等多种场景,并被阿里巴巴、腾讯等一线互联网公司广泛使用。其主要版本包括 MongoDB Atlas(云服务)、MongoDB Enterprise Advanced(商业版)和 MongoDB Community Edition(免费版)。自2009年发布1.0版本以来,MongoDB 不断创新,最新版本为7.0,在性能和功能上持续优化。
36 12
|
18天前
|
人工智能 NoSQL MongoDB
阿里云与MongoDB庆祝合作五周年,展望AI赋能新未来
阿里云与MongoDB庆祝合作五周年,展望AI赋能新未来
|
2月前
|
存储 人工智能 NoSQL
使用 MongoDB 构建 AI:Gradient Accelerator Block 如何在几秒钟内让您从零开发 AI
借助 MongoDB,开发者可以存储任何结构的数据,然后使用单一查询 API 和驱动程序将这些数据用于 OLTP、文本搜索和向量搜索处理。
|
2月前
|
人工智能
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
181 2
|
2月前
|
人工智能 NoSQL 测试技术
使用 MongoDB 构建 AI:Patronus 如何自动进行大语言模型评估来增强对生成式 AI 的信心
若需了解更多MongoDB Atlas相关内容,可前往:https://www.mongodb.com/zh-cn/atlas
使用 MongoDB 构建 AI:Patronus 如何自动进行大语言模型评估来增强对生成式 AI 的信心
|
2月前
|
人工智能 自然语言处理 NoSQL
|
2月前
|
存储 NoSQL MongoDB
小川科技携手阿里云数据库MongoDB:数据赋能企业构建年轻娱乐生态
基于MongoDB灵活模式的特性,小川实现了功能的快速迭代和上线,而数据库侧无需任何更改
|
2月前
|
人工智能 NoSQL 机器人
MongoDB Atlas与YoMio.AI近乎完美适配:推理更快速、查询更灵活、场景更丰富
随着MongoDB的新发布和革新,YoMio.AI的“闪电式发展”值得期待。
|
3天前
|
存储 JSON NoSQL
学习 MongoDB:打开强大的数据库技术大门
MongoDB 是一个基于分布式文件存储的文档数据库,由 C++ 编写,旨在为 Web 应用提供可扩展的高性能数据存储解决方案。它与 MySQL 类似,但使用文档结构而非表结构。核心概念包括:数据库(Database)、集合(Collection)、文档(Document)和字段(Field)。MongoDB 使用 BSON 格式存储数据,支持多种数据类型,如字符串、整数、数组等,并通过二进制编码实现高效存储和传输。BSON 文档结构类似 JSON,但更紧凑,适合网络传输。
30 15