Atlas Vector Search:借助语义搜索和 AI 针对任何类型的数据构建智能应用

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
简介: 一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用

Atlas Vector Search已正式上线!

Vector Search(向量搜索)现在支持生产工作负载,开发者可以继续构建由语义搜索和生成式人工智能驱动的智能应用,同时通过 Search Node(搜索节点)优化资源消耗并提高性能。

image.png

这一刻终于到来:人工智能已触手可及。曾经,数据科学与机器学习是高深莫测的领域,仅为企业内部的专业人士所掌握;然而如今,这些技术的神秘面纱已被揭开,现已向世界各地的创造者敞开了大门。

但若想深入挖掘这些新兴工具的巨大潜能,开发者需要一个可信赖、可灵活组合、精巧高效的数据平台作为基础。同时,这些新能力的效果好坏,取决于它们能够获取的数据或“基本事实”的质量。

因此,我们为 MongoDB Atlas 开发者数据平台增加了一项新的功能,让开发者的数据释放出无限可能,助力 AI 应用的发展——MongoDB 隆重推出全新的 Vector Search 功能,它能够适应各种形式的数据需求,让我们的合作伙伴享受这些惊人新功能带来的好处。

向量搜索的原理和优势

Vector Search 是一种基于语义或数据含义,而不是基于数据本身来查询数据的功能。这种功能的实现原理是,把任何形式的数据转换成数字向量,再用高级算法进行相互比较。

第一步是获取源数据,可以是文本、音频、图像或视频数据源,并使用“编码模型”将其转换为“向量”或“嵌入”。得益于人工智能的最新进展,这些向量现在能够将低维数据投影到包含更多数据上下文的高维空间,从而更准确地理解数据的含义。

一旦数据转换成数字表示,就可以使用“近似最近邻”算法查找相似的值,这种算法可以让查询非常快速地找到具有相似向量的数据。用户可以使用自然语言进行查询,例如:“推荐一些悲伤的电影”,或“找一些类似……的图片”。这项功能解锁了全新的可能性。

image.png

MongoDB Atlas平台已原生内置向量搜索!

MongoDB Atlas 已原生内置此功能,开发者无需复制和转换数据、无需学习新的技术栈和语法,也无需管理一整套新的基础设施。借助 MongoDB 的 Atlas Vector Search,开发者可以在一个经过实战考验的出色平台中利用这些强大的新功能,以前所未有的速度构建应用。

有效使用 AI 和 Vector Search 所面临的许多挑战,都源于保证应用数据安全所涉及到的复杂性。这些繁琐的任务会降低开发效率,并让应用的构建、调试和维护变得更加困难。MongoDB 消除了所有这些挑战,同时将 Vector Search 的强大能力整合到平台中,无论面对什么样的工作负载,该平台都能灵活地纵向和横向扩展,轻松应对。

最后,如果没有安全性和可用性的保证,这一切都毫无意义。MongoDB 致力于提供安全的数据管理解决方案,通过冗余和自动故障转移保证高可用性,让应用始终稳定运行。

MongoDB.local 伦敦见面会发布的新功能

在 .Local 伦敦见面会上,我们很高兴地宣布推出专门的Vector Search 聚合阶段,它可以通过 $vectorSearch 调用。这个新的聚合阶段引入了一些新概念,增加了新的能力,使得 Vector Search 比以往任何时候都更容易使用。

借助 $vectorSearch,开发者还可以通过 MQL 语法使用预过滤器(如 $gte、$eq 等),以在遍历索引时过滤掉一些文档,从而获得一致的结果和更高性能。任何了解 MongoDB 的开发者都能够轻松使用此过滤功能!

最后,我们还介绍了在聚合阶段内部调整结果的两种方法,即“numCandidates”和“limit”参数。通过这些参数,开发者可以调整应该成为近似最近邻搜索候选者的文档数量,然后通过“limit”限制结果数量。

它如何与生态系统交互?

人工智能的发展日新月异,让人叹为观止,而开源社区的突飞猛进也令人赞叹不已。开源语言模型以及将它们集成到应用中的各种方法取得了巨大的进步。人工智能展现出了强大力量,因此,建立一个能够让开发者自由发挥的坚实抽象也变得前所未有地重要。基于这样的考虑,我们非常激动地告诉大家,LangChain 和 LlamaIndex 支持我们的多种功能,包括 Vector Search、聊天日志 (Chat Logging) 和文档索引等。我们正在快速推进,并将继续为主要提供商发布新功能。
image.png

总结

一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用。我们还会不断研究和支持更多的框架和插件架构。但始终不变的是,这一切的核心都是开发者。我们将与社区交流,找到最合适的服务方式,让开发者在每一步都感到满意。放手去创造吧!

点击【阅读原文】访问中文官网Vector Search产品页,并获取教程和更多AI资源。

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
2天前
|
机器学习/深度学习 传感器 人工智能
AI技术在医疗领域的应用与挑战
【8月更文挑战第29天】人工智能(AI)技术在医疗领域的应用日益广泛,为患者提供更精准、高效的医疗服务。本文将探讨AI技术在医疗领域的应用及其面临的挑战,包括诊断辅助、药物研发、患者管理和远程监测等方面。我们将通过实际案例和数据来展示AI技术在医疗领域的优势,并讨论其未来发展的可能性和潜在问题。
|
1天前
|
人工智能 自然语言处理 搜索推荐
10分钟构建AI客服:阿里云技术解决方案评测
在数字化转型的浪潮中,企业对客户服务的即时性和个性化需求愈发迫切。阿里云推出的“10分钟构建AI客服并应用到网站、钉钉、微信中”的技术解决方案,为企业提供了一个快速、低成本的AI客服部署方案。本文将从部署流程、用户体验、成本效益等方面对这一方案进行深入评测。
14 3
|
1天前
|
人工智能 自然语言处理 Python
探索AI在文本情感分析中的应用
【8月更文挑战第30天】本文将介绍如何利用人工智能技术进行文本情感分析,并展示一个实际的代码示例。我们将使用Python编程语言和自然语言处理库来实现一个简单的情感分析模型。通过这篇文章,读者将了解到如何使用AI技术来分析和理解文本中的情感。
9 1
|
2天前
|
人工智能 缓存 数据库
安卓应用开发中的性能优化技巧AI在医疗诊断中的应用
【8月更文挑战第29天】在安卓开发的广阔天地里,性能优化是提升用户体验、确保应用流畅运行的关键所在。本文将深入浅出地探讨如何通过代码优化、资源管理和异步处理等技术手段,有效提升安卓应用的性能表现。无论你是初学者还是资深开发者,这些实用的技巧都将为你的安卓开发之路增添光彩。
|
2天前
|
机器学习/深度学习 人工智能 Android开发
揭秘AI编程:从零开始构建你的第一个机器学习模型移动应用开发之旅:从新手到专家
【8月更文挑战第29天】本文将带你走进人工智能的奇妙世界,一起探索如何从零开始构建一个机器学习模型。我们将一步步解析整个过程,包括数据收集、预处理、模型选择、训练和测试等步骤,让你对AI编程有一个全面而深入的理解。无论你是AI初学者,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启示。让我们一起开启这段激动人心的AI编程之旅吧! 【8月更文挑战第29天】在这篇文章中,我们将探索移动应用开发的奇妙世界。无论你是刚刚踏入这个领域的新手,还是已经有一定经验的开发者,这篇文章都将为你提供有价值的信息和指导。我们将从基础开始,逐步深入到更复杂的主题,包括移动操作系统的选择、开发工具的使用、
|
2天前
|
人工智能 算法 数据安全/隐私保护
AI在医疗诊断中的应用与挑战
【8月更文挑战第29天】本文主要探讨了人工智能(AI)在医疗诊断中的应用及其所面临的挑战。通过分析AI技术在医疗领域的实际案例,我们深入了解了AI如何帮助医生提高诊断的准确性和效率。同时,我们也讨论了AI在医疗诊断中可能遇到的挑战,如数据隐私、算法偏见等问题,并提出了相应的解决策略。
|
3天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗诊断中的应用
【8月更文挑战第28天】随着人工智能技术的不断发展,其在医疗领域的应用也越来越广泛。本文将介绍AI技术在医疗诊断中的应用,包括医学影像分析、基因数据分析和疾病预测等方面。通过代码示例,我们将展示如何使用深度学习算法进行医学影像分析和基因数据分析。最后,我们将讨论AI技术在医疗诊断中的优势和挑战。
|
3天前
|
机器学习/深度学习 人工智能 算法
探索AI技术在医疗诊断中的应用
【8月更文挑战第28天】本文将介绍AI技术在医疗诊断中的应用。我们将从基础的机器学习算法开始,然后深入到深度学习和神经网络,最后探讨AI如何改变医疗行业的现状。我们将通过实际的代码示例,展示如何使用Python和TensorFlow库来训练一个用于医疗图像分类的卷积神经网络(CNN)模型。
|
3天前
|
机器学习/深度学习 人工智能 算法
【悬念揭秘】ML.NET:那片未被探索的机器学习宝藏,如何让普通开发者一夜变身AI高手?——从零开始,揭秘构建智能应用的神秘旅程!
【8月更文挑战第28天】ML.NET 是微软推出的一款开源机器学习框架,专为希望在本地应用中嵌入智能功能的 .NET 开发者设计。无需深厚的数据科学背景,即可实现预测分析、推荐系统和图像识别等功能。它支持多种数据源,提供丰富的预处理工具和多样化的机器学习算法,简化了数据处理和模型训练流程。
15 1
下一篇
云函数