官方博客-第16页-阿里云开发者社区

赫曦

2024-05-15

93203

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,203

子白

2024-05-15

102460

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,460

ModelScope

2024-05-15

960

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

960

柳遵飞

2024-12-11

977

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

977

望宸魁宇

2025-04-07

427

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

427

望雲十雨言澈

2025-04-10

567

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

567

宗衡

2025-07-10

740

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

740

杨永

2024-05-15

93884

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,884

ModelScope

2024-05-15

1953

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,953

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

SpringCloud 应用 Nacos 配置中心注解

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AI Infra之模型显存管理分析

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

使用KMS为MSE-Nacos敏感配置加密的最佳实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

SpringCloud 应用 Nacos 配置中心注解

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AI Infra之模型显存管理分析

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

使用KMS为MSE-Nacos敏感配置加密的最佳实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践