官方博客-第8页-阿里云开发者社区

子白

2024-05-15

102427

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,427

杨永

2024-05-15

93856

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,856

问思望宸

2024-08-12

8704

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,704

何亮阿里云云原生

2025-01-24

765

使用 Apifox、Postman 测试 Dubbo 服务，Apache Dubbo OpenAPI 即将发布

Apache Dubbo 3.3.3（即将发布）实现了与 OpenAPI 的深度集成，通过与 OpenAPI 的深度集成，用户能够体验到从文档生成到接口调试、测试和优化的全流程自动化支持。不论是减少手动工作量、提升开发效率，还是支持多语言和多环境，Dubbo 3.3.3 都展现了其对开发者体验的极大关注。结合强大的 Mock 数据生成和自动化测试能力，这一版本为开发者提供了极具竞争力的服务治理解决方案。如果你正在寻找高效、易用的微服务框架，Dubbo 3.3.3 将是你不容错过的选择。

何亮阿里云云原生

765

墨飏

2025-04-17

657

MCP 的 AI 好搭档

本文介绍了MCP（模型上下文协议）及其在AI领域的应用前景。MCP由Anthropic公司推出，通过标准化通信协议实现AI与数据源间的安全隔离，解决了传统AI应用中的数据隐私和安全问题。文章探讨了从LLM到MCP的进化过程，并分析了其面临的挑战，如算力不足和开放性需求。Serverless技术被提出作为解决这些问题的方案，提供弹性算力和支持安全沙箱环境。最后，文章提供了如何一键部署热门MCP Server的教程，帮助开发者快速上手并体验该协议的实际应用效果。

墨飏

657

豁朗

2022-05-16

2212

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,212

赫曦

2024-05-15

93168

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,168

阿里云云原生

2024-05-15

55702

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,702

阿里云云原生

2024-05-15

383

基于Serverless搭建批量打马赛克服务

本方案实现在阿里云Serverless函数计算服务中搭建图片批量打马赛克服务，具备自动将用户上传到OSS桶内的图片批量打上马赛克功能，实现用户敏感信息自动化处理。

阿里云云原生

383

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

使用KMS为MSE-Nacos敏感配置加密的最佳实践

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

使用 Apifox、Postman 测试 Dubbo 服务，Apache Dubbo OpenAPI 即将发布

MCP 的 AI 好搭档

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Higress 全新 Wasm 运行时，性能大幅提升

基于Serverless搭建批量打马赛克服务

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

使用KMS为MSE-Nacos敏感配置加密的最佳实践

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

使用 Apifox、Postman 测试 Dubbo 服务，Apache Dubbo OpenAPI 即将发布

MCP 的 AI 好搭档

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Higress 全新 Wasm 运行时，性能大幅提升

基于Serverless搭建批量打马赛克服务