LLMs 记忆体全新升级:六大新功能全面出击,用户体验值拉满!

简介: LLMs 时代之下,CVP Stack 必不可少。

LLMs 时代之下,CVP Stack 必不可少。

其中,C 代表以 ChatGPT 为代表的大模型,它在 AI 程序中充当中央处理器的角色;V 代表 Vector Database,即以 Zilliz Cloud 和 Milvus 为代表的向量数据库,为大模型提供知识存储;P 代表Prompt Engineering,各环节通过 prompt 的方式进行交互。

为给用户带来更好、更流畅的体验,作为 LLMs 记忆体的 Zilliz Cloud 再次进行版本更新!本次,我们新增了价格计算器、取消存储配额限制、自动暂停不活跃数据库等功能,用户体验感再上新台阶。通过阅读本文,用户可以快速、详尽地了解 Zilliz Cloud 的六大新功能!

01. 价格计算器

Zilliz Cloud 新增的价格计算器[1]功能,能够帮用户更好地估算所需资源成本。操作方式十分简单,用户只需选择偏好的计算单元(CU)类型和云服务提供商,并输入需要存储的 entity 数量和向量维度,就可以快速计算所需的 CU 大小和资源成本。

1.png
价格计算器

目前,价格计算器仅支持计算向量数据。未来,我们将支持标量数据,让成本计算精确再精确。

02. 支持 GCP 上备份和恢复数据

Zilliz Cloud 新版本支持在 Google Cloud Platform(GCP)上备份和恢复数据,这将大大提高系统的弹性,确保在遇到各种突发状况的情况下,用户业务的连续性不受影响。

03. 取消存储配额限制

Zilliz Cloud 新版本取消了存储配额限制。自此,用户可以将数据导入至未加载的集合中,且无需担心超过存储限制。不过,需要注意的是,每个数据库的负载容量取决于其 CU 大小。为此,我们也强烈建议用户使用价格计算器来选择和需求最为适配的数据库。

此外,我们也优化了通知系统以提升用户体验。如果数据量超过数据库 CU 大小可负载的容量,Zilliz Cloud 将立刻向用户发送通知,提醒数据导入可能会失败并提供相应解决方法。

04. 自动暂停不活跃数据库

Zilliz Cloud 能否自动暂停不活跃的数据库,以帮助用户节省 credit 和成本?当然可以!当数据库出现连续 14 天不活跃的情况,Zilliz Cloud 会自动暂停。需要强调的是,这中间我们不会删除任何数据,用户随时按需继续使用数据库。

05. 支持自定义时区

Zilliz Cloud 新版本支持设置自定义时区,以确保所有数据的时间戳更为准确,满足不同国家、不同区域用户的时间显示需求。

06. 支持重命名 Collection

Zilliz Cloud 新版本支持重命名数据库 Collection,方便用户轻松、灵活管理,降低时间管理成本。这意味着,只要使用本功能,用户就不需要再创建新的 Collection 或迁移 Collection 数据。

其他改进

除上述六大新功能外,Zilliz Cloud 新版本还进行了以下改进

  • 优化计费界面;

  • 优化 CU 类型命名——从 ”high-performance CU“ 和 ”big-data CU“ 改为 ”performance-optimized CU“ 和 ”capacity-optimized CU“。

更多详情,请阅读 Zilliz Cloud[2] 发版说明。

🌟【相关链接】🌟

[1] 价格计算器:https://zilliz.com/pricing
[2] Zilliz Cloud 发版说明:https://zilliz.com/doc/release_notes
[3] Zilliz Cloud 注册链接:https://cloud.zilliz.com/signup

如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。

目录
相关文章
|
26天前
|
文字识别 测试技术 开发者
Qwen3-VL新成员 2B、32B来啦!更适合开发者体质
Qwen3-VL家族重磅推出2B与32B双版本,轻量高效与超强推理兼备,一模型通吃多模态与纯文本任务!
1512 11
|
3月前
|
存储 人工智能 NoSQL
万字解码 Agentic AI 时代的记忆系统演进之路
本文深入探讨了在 Agentic AI 时代,记忆(Memory) 作为智能体核心能力的定义、构建与技术演进。
万字解码 Agentic AI 时代的记忆系统演进之路
|
2月前
|
人工智能 安全 API
Dify平台集成安全护栏最佳实践
Dify平台提供低代码构建AI大模型应用的解决方案,支持云服务与私有化部署。本文介绍了在工作流和Agent中集成安全护栏的最佳实践,包括插件和扩展API两种方案。插件方式适用于工作流,一键安装实现输入输出防控;扩展API方式适用于Agent和工作流私有化部署场景,通过本地服务适配安全护栏API。文中还详细说明了操作步骤、前提条件及常见问题处理方法,帮助用户快速实现内容安全控制。
|
6月前
|
人工智能 供应链 安全
MCP Server的五种主流架构与Nacos的选择
本文深入探讨了Model Context Protocol (MCP) 在企业级环境中的部署与管理挑战,详细解析了五种主流MCP架构模式(直连远程、代理连接远程、直连本地、本地代理连接本地、混合模式)的优缺点及适用场景,并结合Nacos服务治理框架,提供了实用的企业级MCP部署指南。通过Nacos MCP Router,实现MCP服务的统一管理和智能路由,助力金融、互联网、制造等行业根据数据安全、性能需求和扩展性要求选择合适架构。文章还展望了MCP在企业落地的关键方向,包括中心化注册、软件供应链控制和安全访问等完整解决方案。
3031 159
MCP Server的五种主流架构与Nacos的选择
|
2月前
|
人工智能 Ubuntu 数据可视化
【详细教程】如何在Ubuntu上本地部署Dify?
Dify 是一个开源的大语言模型应用开发平台,支持低代码/无代码开发,提供多模型接入、Agent框架、RAG检索增强生成等功能,助力快速构建AI应用。支持本地部署,提供详尽文档与可视化界面,适用于聊天助手、文本生成、自动化任务等多种场景。
1487 124
|
机器学习/深度学习 算法
R语言超参数调优:深入探索网格搜索与随机搜索
【9月更文挑战第2天】网格搜索和随机搜索是R语言中常用的超参数调优方法。网格搜索通过系统地遍历超参数空间来寻找最优解,适用于超参数空间较小的情况;而随机搜索则通过随机采样超参数空间来寻找接近最优的解,适用于超参数空间较大或计算资源有限的情况。在实际应用中,可以根据具体情况选择适合的方法,并结合交叉验证等技术来进一步提高模型性能。
|
Ubuntu 应用服务中间件 Linux
Linux下搭建Nginx环境的搭建
Linux下搭建Nginx环境的搭建
212 6
|
前端开发 JavaScript API
React 与 React Native 的主要区别
【8月更文挑战第7天】 React 与 React Native 的主要区别
2409 3
【51单片机】开发板上矩阵键盘键码在数码管上的显示,按下键盘在数码管上显示对应段码
【51单片机】开发板上矩阵键盘键码在数码管上的显示,按下键盘在数码管上显示对应段码
553 0
|
Linux 编译器 数据处理
探索Linux中的`ld`命令:链接器的奥秘
`ld`是Linux的链接器,集成在GNU Binutils中,将.o文件与库合并成可执行或共享库。它处理符号引用、重定位,支持多种文件格式及静态/动态链接。常用参数包括-o指定输出,-l和-L添加库和搜索路径。通常通过编译器驱动程序如gcc调用以简化链接过程。理解符号解析、选择静态/动态链接及管理库版本是使用ld的关键。使用--verbose选项有助于调试。