官方博客-第10页-阿里云开发者社区

乐忱

2024-06-14

39945

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,945

望宸

2025-02-07

849

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

849

悟鸣

2024-05-15

240082

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

240,082

米基

2024-05-15

3843

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,843

扬流

2024-05-15

119147

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,147

砚染

2024-09-03

1601

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,601

刘佳旭

2023-09-26

139044

云原生场景下高可用架构的最佳实践

刘佳旭

139,044

赵世振

2024-12-24

1324

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,324

柳遵飞

2024-12-11

1002

SpringCloud 应用 Nacos 配置中心注解

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

1,002

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

AI时代：云存储加速多模态数据存储与管理创新

浏览量超 10w 的热图，描述 RAG 的主流架构

一文掌握大模型提示词技巧：从战略到战术

大模型推理优化实践：KV cache复用与投机采样

Paimon 与 Spark 的集成（二）：查询优化

速成RAG+Agent框架大模型应用搭建

云原生场景下高可用架构的最佳实践

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

SpringCloud 应用 Nacos 配置中心注解

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI时代：云存储加速多模态数据存储与管理创新

浏览量超 10w 的热图，描述 RAG 的主流架构

一文掌握大模型提示词技巧：从战略到战术

大模型推理优化实践：KV cache复用与投机采样

Paimon 与 Spark 的集成（二）：查询优化

速成RAG+Agent框架大模型应用搭建

云原生场景下高可用架构的最佳实践

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

SpringCloud 应用 Nacos 配置中心注解