官方博客-第19页-阿里云开发者社区

濯光于怀

2025-04-07

407

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

407

缘祺

2024-05-15

112881

浅析MySQL代价估计器

代价估计是优化其中非常重要的一个步骤，研究代价估计的原理和MySQL的具体实现对做SQL优化是非常有帮助。本文有案例有代码，由浅入深的介绍了代价估计的原理和MySQL的具体实现。

缘祺

112,881

ModelScope

2024-05-15

1188

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,188

右予故黎

2024-11-21

1008

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,008

阿里云云原生

2025-01-26

1289

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,289

新念

2025-02-14

1469

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,469

望宸

2025-02-20

688

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

688

望宸魁宇

2025-04-07

447

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

447

阿里云云原生

2025-04-07

712

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

712

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

浅析MySQL代价估计器

vLLM部署Yuan2.0：高吞吐、更便捷

“无”中生有：基于知识增强的RAG优化实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

极氪汽车云原生架构落地实践

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

浅析MySQL代价估计器

vLLM部署Yuan2.0：高吞吐、更便捷

“无”中生有：基于知识增强的RAG优化实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

极氪汽车云原生架构落地实践