白皮书推荐:借助MongoDB将生成式AI和高级搜索嵌入您的应用程序

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: 加群领取白皮书

以前从未有哪一项新技术的推出会如此迅速地吸引企业、政府和消费者的关注。2022 年 11 月,ChatGPT 的面世展示了由大语言模型 (LLM) 提供支持的生成式 AI在解决大量新用例方面的潜力。

现在,似乎只需几个精心设计的提示,即可自动完成一系列工作,生成专业品质的文本、图像、音频、视频和编程代码,为客户提供更出色的支持。应用范围囊括气候变化建模、发现新药、设计新材料、预测金融市场走势...以及其他诸多方面。

“如何利用生成式 AI 颠覆市场,同时自己又不被颠覆?”——快速上升为企业、政府等的一个首要和关键问题。

本文内容摘录自《利用 MongoDB 在应用程序中嵌入生成式人工智能和高级搜索》,若需获取白皮书原版pdf,请见文末获取方式。

您的数据:打造具有独家竞争力GenAI模型的核心要素

当所有其他竞争对手都可以利用生成式人工智能时,您如果要想建立差异化优势,就必须用自己管理有序的数据来增强底层大语言模型 (LLM)。换句话说,您所具备的与众不同的“超能力”差异来自于允许这些模型访问您所拥有的意义非凡的企业资产——您的数据。

同时,技术领导者也很快意识到,GenAI 除了能提供潜在好处外,现阶段的不成熟也会带来风险。他们不能就这样丢弃多年来摸索出的最佳运营实践和制度化知识。相反,他们需要确保现有系统以及正在开发的新应用程序都能够以安全、可靠和准确的方式利用生成式 AI。您需要考虑如何在适当的安全控制下打造 AI 赋能的应用程序,同时达到用户期望的可扩展性和性能水平。
在本白皮书中,我们将讨论 MongoDB 如何助您实现这些目标,同时使用您自己的数据助力提供令人信服的新 GenAI 驱动的应用程序和体验。

向量搜索和LLM工作流程

为了将自己的数据馈送到 AI 模型中,我们需要先将其转换为向量嵌入。本白皮书中将会介绍向量嵌入与向量搜索的优势和用途,例如可嵌入非结构化数据、从“关键词搜索”到“上下文感知语义搜索”的升级等;同时还将介绍LLM执行检索增强生成(Retrieval-Augmented Generation,简称RAG)的工作流程。
image.png

将自定义数据与 LLM 动态结合以生成可靠的相关输出

开发者数据平台:构建智能应用程序的更好选择

向量存储虽至关重要,却只是应用程序,或AI生态系统的一部分,还必须能够管理非向量化的常规业务数据(如客户记录、订单和库存、交易和事务、报价、地理空间坐标、社交媒体动态...等等)所有这些数据都需要进行查询才能为应用程序功能提供强大支持。

此外,我们还需要执行一些非功能性操作——例如满足正常运行时间、性能和可扩展性SLA 的要求、集成新功能、保护和备份数据,以及审核数据...

然而将各种技术结合使用以增强新的 AI驱动体验,并将其整合到您的应用程序中,则会导致增加大量单点产品且复杂性攀升,给您的团队带来巨大开销、降低开发者的效率、并可能减缓应用落地的速度等。

image.png

因此,使用基于 MongoDB Atlas 构建的开发者数据平台是一种更好的选择。开发者数据平台统一了操作、分析和生成式 AI 数据服务,可简化构建智能应用程序的过程。从原型到生产,借助 Atlas,您可以确保自己的应用程序基于真实的最新操作数据事实,同时满足用户期望的规模、安全性和性能。Atlas的灵活文档数据模型以及开发者原生查询 API,帮助开发者能够显著加快创新速度,抓住生成式AI 带来的新市场机遇。

image.png

MongoDB Atlas 集成了将 AI 引入应用程序所需的数据服务

3个热门用例:如何利用 MongoDB Atlas 构建AI强化应用?

● 客户自助式聊天机器人和问答
● 高级电子商务搜索和建议
● 富媒体(多模式)分析和生成

这三个示例都依赖于生成式 AI 和高级语义搜索,可打造令人惊艳的用户体验,并解锁以前大多数组织所无法触及的功能。

在本白皮书中,我们将依次介绍每个使用案例,展示架构设计模式以及每位开发者利用人工智能和高级搜索所需的基本功能。

image.png
image.png

白皮书截图

MongoDB Vector Search的实际应用

MongoDB 旗下产品已广泛用于传统的 AI 用例。
● Continental 选择将 MongoDB 用作其 Vision Zero 自动驾驶计划中的特征工程平台。
● 博世和西班牙电信均在其 AI 增强的物联网平台中使用MongoDB。
● Kronos 使用 MongoDB 中的数据来配置和构建机器学习模型,每天交易的加密货币达到数十亿美元。
● Iguazio 使用 MongoDB 作为其数据科学和 MLOps 平台的持久层。
● H2O.ai 和 Featureform 支持 MongoDB 作为其各自平台中的功能存储。

在此基础上,MongoDB Atlas 如今已用于各种应用程序,不断突破 GenAI 的可能性。我们的案例包括:
● Ada:帮助 Meta、ATT 和 Verizon 等公司通过 AI 驱动的自动化和会话 AI 更好地为客户提供支持。
● ExTrac:通过分析实时数据流,识别潜在的人身伤害危险和数字风险并对这些风险分类。
● Eni:提供地质数据并将其变为可操作数据,从而更好地制定决策,帮助公司加快实现净零排放。
● Inovaare:在整个医疗保健生命周期中对数据进行持续监控、提取和分类,以进行监管合规性报告、审计和风险评估。
● Source Digital:在将其视频检测平台从 PostgreSQL 迁移到 MongoDB Atlas 后,成本降低了 7 倍。
● Catylex:对合同条款进行自动提取、分类和分析,以确定权利、义务和风险。
● Robust Intelligence:通过其 AI 防火墙产品实时验证输入和输出,保护投入使用的大语言模型 (LLM)。
● Potion:使用自定义视觉和音频模型重新生成视频和音频流。

软件工具供应商 Retool 的 AI 现状调查反映了 MongoDB 在 AI 开发者中的受欢迎程度,该调查得出结论,MongoDB Atlas Vector Search:

  1. 在考察的所有向量数据库中,此 MongoDB 数据库的净推荐值 (NPS) 最高。
  2. 在产品发布后的几个月内,便已一跃成为应用范围第二广泛的向量数据库,领先于已经上市多年的替代解决方案。

无论您是在初创公司还是企业中构建下一个重大应用,借助 MongoDB Atlas,您可以:

● 加快构建基于真实的操作数据事实的生成式 AI 强化应用程序。
● 通过使用单个平台来简化技术堆栈,该平台允许您的应用将操作数据和向量嵌入存储在同一位置,使用无服务器功能对源数据的变化做出反应,并在多种数据形式之间进行搜索,从而提高应用生成的响应的相关性和准确性。
● 凭借文档模型的灵活性,轻松开发生成式 AI 强化应用,同时维持简单、优质的开发者体验。
● 无缝集成领先的 AI 服务和系统(如超大规模服务提供商和开源 LLM 及框架),以在动态市场中保持竞争力。
● 在高性能、高度可扩展的操作数据库上构建 GenAI 强化应用程序,该数据库在各种 AI 用例中经过了十年的验证。

扫码加入钉群,领取白皮书。与MongoDB专家一对一沟通,了解更多阿里云MongoDB产品与方案,市场活动及线上培训等内容。
4D23CF4C-EABF-40B3-80BE-5E4EDE071C42.png

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
24天前
|
存储 人工智能 搜索推荐
如何用大模型+RAG 给宠物做一个 AI 健康助手?——阿里云 AI 搜索开放平台
本文分享了如何利用阿里云 AI 搜索开放平台,基于 LLM+RAG 的系统框架,构建“宠物医院AI助手”的实践过程。
228 14
|
22天前
|
人工智能 自然语言处理 搜索推荐
AI 搜索开放平台重磅发布:Qwen3 模型上线啦
阿里云AI搜索开放平台重磅发布最新Qwen3模型,为企业和开发者提供全栈智能搜索解决方案。Qwen3作为最新一代大模型,在推理、多语言支持和Agent能力上表现卓越。用户可通过三步快速体验Qwen3服务,助力业务在AI时代抢占先机。
186 12
|
1月前
|
人工智能 搜索推荐 自然语言处理
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
本文分享了大模型落地的关键:如何用阿里云 AI 搜索开放平台 打造更智能的 AI 搜索。
185 8
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
|
14天前
|
人工智能 自然语言处理 文字识别
阿里云 AI 搜索开放平台新增:服务开发能力
阿里云 AI 搜索开放平台新发布:服务开发能,可通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。
115 0
|
1月前
|
人工智能 自然语言处理 算法
阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级
本文介绍了阿里云 AI 搜索开放平台的技术的特点及其在各行业的应用。
205 3
|
3月前
|
存储 人工智能 自然语言处理
Lindorm作为AI搜索基础设施,助力Kimi智能助手升级搜索体验
月之暗面旗下的Kimi智能助手在PC网页、手机APP、小程序等全平台的月度活跃用户已超过3600万。Kimi发布一年多以来不断进化,在搜索场景推出的探索版引入了搜索意图增强、信源分析和链式思考等三大推理能力,可以帮助用户解决更复杂的搜索、调研问题。Lindorm作为一站式数据平台,覆盖数据处理全链路,集成了离线批处理、在线分析、AI推理、融合检索(正排、倒排、全文、向量......)等多项服务,支持Kimi快速构建AI搜索基础设施,显著提升检索效果,并有效应对业务快速发展带来的数据规模膨胀和成本增长。
|
2天前
|
SQL 人工智能 自然语言处理
阿里云 AI 搜索开放平台新功能发布:新增GTE自部署模型
阿里云 AI搜索开放平台正式推出 GTE 多语言通用文本向量模型(iic/gte_sentence-embedding_multilingual-base)
|
1月前
|
人工智能 自然语言处理 搜索推荐
阿里云 AI 搜索开放平台新功能发布:大模型联网能力上线
阿里云 AI 搜索开放平台此次新增了大模型联网能力,通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。
413 25
|
1月前
|
人工智能 搜索推荐 前端开发
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
OpenDeepSearch是基于开源推理模型的深度搜索工具,通过语义重排和多源整合优化检索效果,支持与AI代理无缝集成,提供快速和专业两种搜索模式。
193 10
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
|
1月前
|
人工智能 算法 安全
OpenRouter 推出百万 token 上下文 AI 模型!Quasar Alpha:提供完全免费的 API 服务,同时支持联网搜索和多模态交互
Quasar Alpha 是 OpenRouter 推出的预发布 AI 模型,具备百万级 token 上下文处理能力,在代码生成、指令遵循和低延迟响应方面表现卓越,同时支持联网搜索和多模态交互。
175 1
OpenRouter 推出百万 token 上下文 AI 模型!Quasar Alpha:提供完全免费的 API 服务,同时支持联网搜索和多模态交互