如何用MongoDB Atlas和大语言模型,高效构建企业级AI应用?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 利用生成式 AI 强化应用程序为客户打造令人叹服、真正差异化的体验意味着将人工智能建立在事实的基础之上

利用生成式 AI 强化应用程序为客户打造令人叹服、真正差异化的体验意味着将人工智能建立在事实的基础之上。这种事实来自于您的数据,更具体地说,来自于您最新的操作数据。

无论您是提供具有高级语义搜索的高度个性化体验,还是生成用户提示的内容和对话,MongoDB Atlas 都可以统一操作、分析和向量搜索数据服务,以简化将大语言模型 (LLM) 和转换器模型的强大功能嵌入到您的应用程序中。

开发者每天都在构建下一代具有突破性和变革性的采用生成式 AI 技术的应用程序。商业 LLM 和开源 LLM 正在以惊人的速度发展。围绕它们构建的框架和工具数不胜数,创新也变得大众化了。然而,开发团队必须跨越鸿沟,将这些应用程序从原型转变为企业就绪。

首先,这些大型模型提供的答案可能不正确或信息依据不足,因为它们访问的数据过时了。解决答案信息依据不足的问题有两种方法:优化大型模型或为其提供长期记忆。但是,这样做会产生第二个障碍,在采取了正确的安全控制措施的情况下,以用户期望的规模和性能围绕有信息依据的 LLM 部署应用程序。

开发者需要使用具有灵活数据模型的数据平台,以适应不断变化的非结构化和结构化数据,以便为大型模型提供信息,而不会受限于僵化的模式。

虽然优化模型是一种方法,但在时间和计算资源方面成本过高。这意味着开发者需要能够将数据作为提示的上下文呈现给大型模型。他们需要为这些生成式模型提供长期记忆。

下面我们将讨论一些示例,说明如何使用各种 LLM 和生成式 AI 框架实现这一点。

点击链接查看我们的 AI 资源页面,详细了解有关使用 MongoDB 构建采用 AI 技术的应用。

开始使用 MongoDB Atlas和大语言模型的五个资源

MongoDB Atlas 可以无缝集成领先的生成式 AI 服务和系统,如超大规模服务提供商和开源 LLM 及框架。通过 Atlas 数据库和 Atlas Vector Search将文档和向量嵌入数据存储结合使用,开发者可以加速构建基于真实操作数据的生成式 AI 强化应用程序。

以下是如何使用热门的 LLM 框架和 MongoDB 的示例:

开始使用Atlas Vector Search 和 OpenAI 进行语义搜索

本教程将引导您完成使用 MongoDB Atlas 对示例电影数据集执行语义搜索的步骤。首先,您将设置 Atlas Trigger,以便在将新文档插入集群时调用 OpenAI API,从而将其转换为向量嵌入。然后,您将使用 Atlas Vector Search 执行向量搜索查询。甚至还有一个特殊的奖励部分:利用 HuggingFace 模型。
image.png

阅读教程:https://www.mongodb.com/developer/products/atlas/semantic-search-mongodb-atlas-vector-search/

借助Llamalndex和MongoDB,使用您的专有数据构建生成式 AI 强化聊天应用

LlamaIndex 提供的简单而灵活的接口可以连接 LLM 与外部数据。这篇由 LlamaIndex 和 MongoDB 联合撰写的博客详细介绍了为什么以及如何构建自己的聊天应用。博客中附带的 notebook 提供了有关如何使用英语语言查询来查询任何 PDF 文档的代码演练。
image.png

阅读博客:https://medium.com/llamaindex-blog/build-a-chatgpt-with-your-private-data-using-llamaindex-and-mongodb-b09850eb154c

了解如何将 Atlas Vector Search 用作 LangChain 的向量存储

正如合作伙伴关系公告博客文章中所述,LangChain 和 MongoDB Atlas 实属天作之合,有机社区所表现出的热情证明了这一点,促成了 LangChain 中针对 MongoDB 的多次集成。除了现在支持 Atlas Vector Search 作为向量存储之外,还已经支持将 MongoDB 用作聊天日志历史记录。
image.png

网址阅读博客:https://js.langchain.com/docs/integrations/vectorstores/mongodb_atlas/

使用 MindsDB AI 集合直接在 MongoDB Atlas 中生成预测

MindsDB 是一个开源机器学习平台,它将自动机器学习引入数据库中。在此博客中,您将使用 MindsDB AI 集合直接在 Atlas 中生成预测,这样您就能够将预测数据用作常规数据来消费使用,查询这些预测数据,并通过简化部署工作流程来加快开发速度。

通过Atlas Triggers 将 HuggingFace 转换器模型集成到 MongoDB Atlas 中

HuggingFace 是一个 AI 社区,可以轻松构建、训练和部署机器学习模型。利用 Atlas Triggers 以及 HuggingFace,您可以轻松地应对操作数据的变化,这些数据为您的模型提供了长期记忆。了解如何设置 Triggers 以自动预测 MongoDB 数据库中新文档的情感信息,并将其作为附加字段添加到您的文档中。
image.png

阅读博客:https://github.com/philschmid/huggingface-mongodb-example

示例应用架构显示了外部或专有数据如何为 LLM 提供长期记忆,以及数据如何从用户的输入流向由 LLM 提供支持的响应。

使用 MongoDB 为生成式 AI 强化应用实现从原型到生产

MongoDB 基于 Atlas 构建的开发者数据平台可提供经过优化的现代化开发者体验,同时也经过全球数千家企业的实战测试,能够大规模、安全地运行。

无论您是在初创公司还是企业中构建下一个重大应用,Atlas 都可以让您:

● 加快构建基于真实的操作数据事实的生成式 AI 强化应用程序。
● 通过使用单个平台简化您的应用架构,该平台支持将应用和向量数据存储在同一位置,使用无服务器功能应对源数据的变化,并在多种数据模式中进行搜索,从而提高应用生成的响应的相关性和准确性。
● 凭借文档模型的灵活性,轻松开发生成式 AI 强化应用,同时维持简单、优质的开发者体验。
● 无缝集成领先的 AI 服务和系统(如超大规模服务提供商和开源 LLM 及框架),以在动态市场中保持竞争力。
● 在高性能、高度可扩展的操作数据库上构建生成式 AI 强化应用程序,该数据库在各种 AI 用例中经过了十年的验证。

虽然以上示例是构建更创新的应用所需的构建基块,但 MongoDB 可以帮助您实现从概念到生产再到扩展。

扫码加入钉群,与MongoDB专家一对一沟通,了解更多阿里云MongoDB产品与方案,市场活动及线上培训等内容。
4D23CF4C-EABF-40B3-80BE-5E4EDE071C42.png

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
4天前
|
NoSQL atlas MongoDB
MongoDB白皮书推荐:零售企业构建员工赋能应用程序的痛点与解决方案
良好的数据基础是打造企业机构所需的最佳员工赋能产品的前提,而 MongoDB Realm 所具备功能性和灵活性足以全面提升员工效率,避免增加基础设施的负担
2202 3
|
2天前
|
机器学习/深度学习 人工智能 算法
【AI】从零构建深度学习框架实践
【5月更文挑战第16天】 本文介绍了从零构建一个轻量级的深度学习框架tinynn,旨在帮助读者理解深度学习的基本组件和框架设计。构建过程包括设计框架架构、实现基本功能、模型定义、反向传播算法、训练和推理过程以及性能优化。文章详细阐述了网络层、张量、损失函数、优化器等组件的抽象和实现,并给出了一个基于MNIST数据集的分类示例,与TensorFlow进行了简单对比。tinynn的源代码可在GitHub上找到,目前支持多种层、损失函数和优化器,适用于学习和实验新算法。
|
4天前
|
人工智能 NoSQL atlas
Atlas Vector Search:借助语义搜索和 AI 针对任何类型的数据构建智能应用
一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用
2229 2
|
4天前
|
人工智能 NoSQL atlas
MongoDB Atlas Vector Search与Amazon Bedrock集成已全面可用
MongoDB Atlas Vector Search知识库与Amazon Bedrock的最新集成,将极大加速生成式AI应用的开发
2160 1
|
4天前
|
人工智能 NoSQL atlas
Fireworks AI和MongoDB:依托您的数据,借助优质模型,助力您开发高速AI应用
我们欣然宣布MongoDB与 Fireworks AI 正携手合作让客户能够利用生成式人工智能 (AI)更快速、更高效、更安全地开展创新活动
2223 1
|
4天前
|
机器学习/深度学习 人工智能 算法
构建高效AI系统:深度学习优化技术解析
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动创新的核心动力。本文将深入探讨在构建高效AI系统中,如何通过优化算法、调整网络结构及使用新型硬件资源等手段显著提升模型性能。我们将剖析先进的优化策略,如自适应学习率调整、梯度累积技巧以及正则化方法,并讨论其对模型训练稳定性和效率的影响。文中不仅提供理论分析,还结合实例说明如何在实际项目中应用这些优化技术。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
构建未来:AI在持续学习系统中的创新应用
【5月更文挑战第11天】 随着人工智能(AI)技术的飞速发展,其在教育领域的应用日益增多。特别是在持续学习系统(Lifelong Learning Systems, LLS)中,AI技术正开启着个性化和适应性教学的新篇章。本文聚焦于AI在LLS中的创新应用,探讨了机器学习、自然语言处理和认知建模等关键技术如何共同作用于构建智能化的学习环境。文章旨在分析当前AI技术在持续学习领域的最新进展,并展望其对未来教育模式的影响。
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
1745 0
与世界同行 2017中国人工智能大会有感
|
人工智能 自动驾驶
2019年上半年收集到的中国人工智能发展详情文章
2019年上半年收集到的中国人工智能发展详情文章