Atlas Vector Search:借助语义搜索和 AI 针对任何类型的数据构建智能应用

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用

Atlas Vector Search已正式上线!

Vector Search(向量搜索)现在支持生产工作负载,开发者可以继续构建由语义搜索和生成式人工智能驱动的智能应用,同时通过 Search Node(搜索节点)优化资源消耗并提高性能。

image.png

这一刻终于到来:人工智能已触手可及。曾经,数据科学与机器学习是高深莫测的领域,仅为企业内部的专业人士所掌握;然而如今,这些技术的神秘面纱已被揭开,现已向世界各地的创造者敞开了大门。

但若想深入挖掘这些新兴工具的巨大潜能,开发者需要一个可信赖、可灵活组合、精巧高效的数据平台作为基础。同时,这些新能力的效果好坏,取决于它们能够获取的数据或“基本事实”的质量。

因此,我们为 MongoDB Atlas 开发者数据平台增加了一项新的功能,让开发者的数据释放出无限可能,助力 AI 应用的发展——MongoDB 隆重推出全新的 Vector Search 功能,它能够适应各种形式的数据需求,让我们的合作伙伴享受这些惊人新功能带来的好处。

向量搜索的原理和优势

Vector Search 是一种基于语义或数据含义,而不是基于数据本身来查询数据的功能。这种功能的实现原理是,把任何形式的数据转换成数字向量,再用高级算法进行相互比较。

第一步是获取源数据,可以是文本、音频、图像或视频数据源,并使用“编码模型”将其转换为“向量”或“嵌入”。得益于人工智能的最新进展,这些向量现在能够将低维数据投影到包含更多数据上下文的高维空间,从而更准确地理解数据的含义。

一旦数据转换成数字表示,就可以使用“近似最近邻”算法查找相似的值,这种算法可以让查询非常快速地找到具有相似向量的数据。用户可以使用自然语言进行查询,例如:“推荐一些悲伤的电影”,或“找一些类似……的图片”。这项功能解锁了全新的可能性。

image.png

MongoDB Atlas平台已原生内置向量搜索!

MongoDB Atlas 已原生内置此功能,开发者无需复制和转换数据、无需学习新的技术栈和语法,也无需管理一整套新的基础设施。借助 MongoDB 的 Atlas Vector Search,开发者可以在一个经过实战考验的出色平台中利用这些强大的新功能,以前所未有的速度构建应用。

有效使用 AI 和 Vector Search 所面临的许多挑战,都源于保证应用数据安全所涉及到的复杂性。这些繁琐的任务会降低开发效率,并让应用的构建、调试和维护变得更加困难。MongoDB 消除了所有这些挑战,同时将 Vector Search 的强大能力整合到平台中,无论面对什么样的工作负载,该平台都能灵活地纵向和横向扩展,轻松应对。

最后,如果没有安全性和可用性的保证,这一切都毫无意义。MongoDB 致力于提供安全的数据管理解决方案,通过冗余和自动故障转移保证高可用性,让应用始终稳定运行。

MongoDB.local 伦敦见面会发布的新功能

在 .Local 伦敦见面会上,我们很高兴地宣布推出专门的Vector Search 聚合阶段,它可以通过 $vectorSearch 调用。这个新的聚合阶段引入了一些新概念,增加了新的能力,使得 Vector Search 比以往任何时候都更容易使用。

借助 $vectorSearch,开发者还可以通过 MQL 语法使用预过滤器(如 $gte、$eq 等),以在遍历索引时过滤掉一些文档,从而获得一致的结果和更高性能。任何了解 MongoDB 的开发者都能够轻松使用此过滤功能!

最后,我们还介绍了在聚合阶段内部调整结果的两种方法,即“numCandidates”和“limit”参数。通过这些参数,开发者可以调整应该成为近似最近邻搜索候选者的文档数量,然后通过“limit”限制结果数量。

它如何与生态系统交互?

人工智能的发展日新月异,让人叹为观止,而开源社区的突飞猛进也令人赞叹不已。开源语言模型以及将它们集成到应用中的各种方法取得了巨大的进步。人工智能展现出了强大力量,因此,建立一个能够让开发者自由发挥的坚实抽象也变得前所未有地重要。基于这样的考虑,我们非常激动地告诉大家,LangChain 和 LlamaIndex 支持我们的多种功能,包括 Vector Search、聊天日志 (Chat Logging) 和文档索引等。我们正在快速推进,并将继续为主要提供商发布新功能。
image.png

总结

一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用。我们还会不断研究和支持更多的框架和插件架构。但始终不变的是,这一切的核心都是开发者。我们将与社区交流,找到最合适的服务方式,让开发者在每一步都感到满意。放手去创造吧!

点击【阅读原文】访问中文官网Vector Search产品页,并获取教程和更多AI资源。

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
3天前
|
机器学习/深度学习 人工智能 算法
AI在医疗诊断中的应用与挑战
【6月更文挑战第13天】本文探讨了人工智能(AI)在医疗诊断领域的应用及其面临的挑战。随着技术的发展,AI已经成为医疗领域的重要工具,尤其在疾病诊断方面显示出巨大潜力。然而,尽管AI技术带来了许多优势,如提高诊断准确性和效率,但同时也存在一些挑战,如数据隐私、算法偏见和法律伦理问题。本文将详细讨论这些应用和挑战,以期为未来的研究和实践提供参考。
|
1天前
|
人工智能 缓存
[AI words] 突破瓶颈:如何将AI words网站构建时间缩短一半
了解我如何优化AI words网站的构建过程,将构建时间从14分钟缩短到仅仅7分钟。本文详细介绍了优化步骤和遇到的挑战。
|
1天前
|
SQL 存储 人工智能
对2024年以AI为中心的公司增长的11项数据预测
对2024年以AI为中心的公司增长的11项数据预测
|
1天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI在故障预测与自动化修复中的应用
【6月更文挑战第15天】本文探讨了人工智能(AI)技术在现代IT运维领域的革新性应用,重点分析了AI如何通过机器学习算法实现对系统故障的预测和自动化修复。文章首先概述了智能化运维的概念及其重要性,随后详细介绍了AI技术在故障检测、诊断和修复过程中的关键作用,并通过实际案例展示了AI运维解决方案的有效性。最后,文章讨论了实施智能化运维的挑战与未来发展趋势。
12 3
|
1天前
|
机器学习/深度学习 人工智能 安全
AI在医疗诊断中的应用及其前景
【6月更文挑战第15天】本文将探讨人工智能(AI)在医疗诊断领域的应用及其前景。我们将分析AI技术如何改变医疗行业的面貌,提高诊断的准确性和效率,以及它在未来可能带来的挑战和机遇。
|
1天前
|
数据采集 机器学习/深度学习 人工智能
智能化运维:AI在IT管理中的应用与挑战
【6月更文挑战第15天】随着人工智能(AI)技术的飞速发展,其在IT运维领域的应用正变得日益广泛。本文将探讨AI技术如何革新传统的IT运维模式,提升效率和准确性,并分析在实施智能化运维过程中可能遇到的挑战。
|
2天前
|
机器学习/深度学习 人工智能 监控
美国空军的首席数据和AI官谈如何通过AI获得战略优势
美国空军的首席数据和AI官谈如何通过AI获得战略优势
|
2天前
|
人工智能 安全 机器人
AI在企业中的应用进入成熟期了吗?
AI在企业中的应用进入成熟期了吗?
|
2天前
|
人工智能 供应链 数据可视化
随着零售商采用AI,位置数据的价值更突出了
随着零售商采用AI,位置数据的价值更突出了
|
2天前
|
机器学习/深度学习 人工智能 算法
AI在医疗诊断中的应用及其挑战
【6月更文挑战第14天】本文探讨了人工智能(AI)在医疗诊断领域的应用,以及其面临的挑战。AI技术,特别是深度学习和机器学习,已经在医疗影像分析、疾病预测和个性化治疗等方面展现出巨大的潜力。然而,尽管AI在医疗诊断中取得了显著的进步,但仍面临着数据隐私、算法透明度和医疗责任等挑战。