MongoDB Atlas与YoMio.AI近乎完美适配:推理更快速、查询更灵活、场景更丰富

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: 随着MongoDB的新发布和革新,YoMio.AI的“闪电式发展”值得期待。

人工智能(AI) 世界正在以闪电般的速度发展,各种应用层出不穷,其中包括目前最为炫酷的新AI聊天机器人之一:角色AI。角色AI可以进行有趣的对话,帮助学习一门新语言,或者创建用户自己的聊天机器人。

YoMio.AI是一家专注角色AI的天使轮初创公司,聚焦AI娱乐,致力于从各方面让AI成为人类的陪伴。YoMio.AI目前主要开发了AI原生娱乐产品Rubii,并围绕Rubii构建了一整套产品矩阵,将Rubii中的功能解构,创造一套独立的服务,其中包括:全球最快的语音生成推理引擎之一;从Rubii上一键将角色放到其他社交平台,例如QQ;提供公开竞技场测评大语言模型的角色扮演能力(Roleplay LLM Arena);快速定制富知识机器人等。

初创公司,尤其是AI初创公司正在以最大限度的想象力在改变着我们每天的生活。他们每天在为我们创造工具,而在这个过程中,AI初创公司也迫切需要好用的工具。YoMio.AI创始人Junity指出,就开发而言,初创公司首先最需要的是统一有效的云架构解决方案,将全部应用迁移到一家云;其次,初创公司需求变化快,需要随时更改表单,非关系型数据库更为适配;此外,多语言全文搜索也是一项必要功能。

为了应对以上挑战与需求,MongoDB Atlas 成为了YoMio.AI近乎完美的适配解决方案。

利用二进制存储缓存张量,实现MongoDB版Prompt Cache,打造全球最快TTS推理引擎之一。

利用MongoDB储存二进制文件的能力,YoMio.AI实现了行业首个GPT-SoVITS极速推理,成功将原版3秒左右一条音频优化到15秒推理出160条音频(注:GPT-SoVITS是一款先进的TTS框架,在Github上超过30000星标,以跨语言、3秒语音无需训练即可克隆而著称)。据Junity介绍,通过MongoDB Atlas,YoMio.AI无需像PostgreSQL装插件来实现中文全文搜索,也无需像Elasticsearch专门配置搜索节点,配置Atlas Index后,仅需简单的代码即可搜索。

Search Index 实现多语言全文搜索

MongoDB 的全文索引可以帮助用户快速地查找包含特定关键字或短语在内的数据。这对很多应用程序来说非常重要,因为可以使用全文索引来快速查找相关数据。在MongoDB支持之下,YoMio.AI不但实现了中日英韩粤多语言搜索,而且能够实现跨语言搜索,甚至是在同一句话中进行混读。

Atlas Vector Search搭配Infinity推理引擎 实现极低延迟且超高性能检索重排

MongoDB Atlas 提供非常丰富的开箱即用功能,向量检索构建了最低延迟且同时满足检索+重排的系统,并且搭建本地Infinity镜像实现embedding+reranker即插即用,单次检索全流程延迟低于50ms。

除此之外,通过Atlas全球集群(Global Cluster),YoMio.AI上述系统在全球任何范围内都是低延迟高可用,而实现这一切仅用了两个月。

YoMio.AI创始人
Junity

YoMio.AI业务分为ToC和ToB两类。ToC为主推的AI角色Rubii,利用丰富的数据和精进的算法,Rubii正在变得更富场景感和体验感;ToB主推富有定制知识的聊天机器人,YoMio.AI内部检索引擎会将客户的文档分块,转换成向量,并且用知识图谱解析,每一次和机器人对话时,机器人都会获得最符合该对话场景下的文档分片。

无论是ToC端还是ToB端,YoMio.AI都在与时代赛跑,始终要拿出最快、最优质的产品。作为YoMio.AI的数据库技术合作伙伴,MongoDB在AI前沿探索方面也开足马力,正在积极探索AI在应用程序现代化改造中的应用,尤其在代码分析、智能模式映射和代码转换等领域。通过引入AI,MongoDB将进一步简化应用现代化的过程,缩短迁移时间,使企业能够更快地适应市场需求。

随着MongoDB的新发布和革新,YoMio.AI的“闪电式发展”值得期待。

MongoDB Atlas

MongoDB Atlas 是 MongoDB 公司提供的 MongoDB 云服务,由 MongoDB 数据库的开发团队构建和运维,可以在亚马逊云科技、Microsoft Azure、Google Cloud Platform 云平台上轻松部署、运营和扩展。MongoDB Atlas 内建了 MongoDB 安全和运维最佳实践,可自动完成基础设施的部署、数据库的构建、高可用部署、数据的全球分发、备份等即费时又需要大量经验运维工作。让您通过简单的界面和 API 就可以完成这些工作,由此您可以将更多宝贵的时间花在构建您的应用上。

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
目录
打赏
0
0
0
0
234
分享
相关文章
node-DeepResearch:开源复现版OpenAI Deep Research,支持多步推理和复杂查询的AI智能体
node-DeepResearch 是一个开源 AI 智能体项目,支持多步推理和复杂查询,帮助用户逐步解决问题。
178 27
node-DeepResearch:开源复现版OpenAI Deep Research,支持多步推理和复杂查询的AI智能体
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
Baichuan-M1-14B 是百川智能推出的首个开源医疗增强大模型,专为医疗场景优化,支持多语言、快速推理,具备强大的医疗推理能力和通用能力。
193 16
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
GLM-Zero:智谱AI推出与 OpenAI-o1-Preview 旗鼓相当的深度推理模型,开放在线免费使用和API调用
GLM-Zero 是智谱AI推出的深度推理模型,专注于提升数理逻辑、代码编写和复杂问题解决能力,支持多模态输入与完整推理过程输出。
234 24
GLM-Zero:智谱AI推出与 OpenAI-o1-Preview 旗鼓相当的深度推理模型,开放在线免费使用和API调用
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
139 11
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是一款开源的AI虚拟试衣工具,能够智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。该工具支持半身和全身试穿模式,操作简单,适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。
199 27
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
120 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
面向高效大模型推理的软硬协同加速技术 多元化 AI 硬件引入评测体系
本文介绍了AI硬件评测体系的三大核心方面:统一评测标准、平台化与工具化、多维度数据消费链路。通过标准化评测流程,涵盖硬件性能、模型推理和训练性能,确保评测结果客观透明。平台化实现资源管理与任务调度,支持大规模周期性评测;工具化则应对紧急场景,快速适配并生成报告。最后,多维度数据消费链路将评测数据结构化保存,服务于综合通用、特定业务及专业性能分析等场景,帮助用户更好地理解和使用AI硬件。
【AI系统】推理文件格式
本文介绍了神经网络模型的序列化与反序列化技术,涵盖跨平台通用序列化方法(如 Protobuf 和 FlatBuffers)、模型自定义序列化方法、语言级通用序列化方法等,重点讨论了这两种流行文件格式的特点、使用场景及其在模型部署中的作用。
60 1
【AI系统】推理文件格式
|
2月前
|
探索MongoDB:发展历程、优势与应用场景
MongoDB 是一个开源的文档型数据库,由 DoubleClick 团队于2007年创立,旨在解决传统数据库的扩展性和灵活性问题。它支持 JSON 格式的存储和查询,具备高可用性、高扩展性和灵活性等优势。MongoDB 适用于社交、物联网、视频直播和内容管理等多种场景,并被阿里巴巴、腾讯等一线互联网公司广泛使用。其主要版本包括 MongoDB Atlas(云服务)、MongoDB Enterprise Advanced(商业版)和 MongoDB Community Edition(免费版)。自2009年发布1.0版本以来,MongoDB 不断创新,最新版本为7.0,在性能和功能上持续优化。
122 12
基于英特尔平台加速 AI 应用及 LLM 推理性能介绍|龙蜥大讲堂第115期
本文摘自龙蜥大讲堂英特尔 AI 软件工程师黄文欢的分享,主要包括以下三个方面的内容: 1. 第五代英特尔至强处理器 2. LLM 推理加速框架 xFast Transformer 及其优化策略 3. 性能数据及 Demo 展示

数据库

+关注