官方博客-第16页-阿里云开发者社区

阿里云PolarDB

2023-08-22

3661

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

本文将介绍PolarDB-X对于向量化SIMD指令的探索和实践，包括基本用法及实现原理，以及在具体算子实现中的思考和沉淀。

阿里云PolarDB

3,661

阿里云PolarDB

2024-05-15

96534

PolarDB-X 开源 | 基于Paxos的MySQL三副本

PolarDB-X 作为PolarDB分布式版，是阿里巴巴自主设计研发的高性能云原生分布式数据库产品，采用 Shared-nothing 与存储分离计算架构，支持集中式和分布式一体化形态，具备金融级数据高可用、分布式水平扩展、混合负载、低成本存储和极致弹性等能力，坚定以兼容MySQL开源生态构建分布式能力，为用户提供高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库服务。

阿里云PolarDB

96,534

子白

2024-05-15

102438

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,438

阿里云云原生

2025-01-06

822

7分钟玩转 AI 应用，函数计算一键部署 AI 生图大模型

人工智能生成图像（AI 生图）的领域中，Stable Diffusion WebUI 以其强大的算法和稳定的输出质量而闻名。它能够快速地从文本描述中生成高质量的图像，为用户提供了一个直观且高效的创作平台。而 ComfyUI 则以其用户友好的界面和高度定制化的选项所受到欢迎。ComfyUI 的灵活性和直观性使得即使是没有技术背景的用户也能轻松上手。本次技术解决方案通过函数计算一键部署热门 AI 生图大模型，凭借其按量付费、卓越弹性、快速交付能力的特点，完美实现低成本，免运维。

阿里云云原生

822

澄潭计缘望宸

2025-03-14

977

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

977

望雲十雨言澈

2025-04-10

547

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

547

阿里云云原生

2025-05-15

878

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

878

探索云世界

2025-08-12

456

「迁移急救包」全云平台无缝迁移云效实操手册

阿里云云效是国内领先的一站式DevOps平台，提供代码全生命周期管理、智能化交付流水线及精细化研发管控，支持多种开发场景。本文详细介绍了从其他平台（如Coding）向云效迁移的完整方案，包括代码仓库、流水线、制品仓库及项目数据的迁移步骤，帮助用户实现高效、安全的平滑迁移，提升研发效率与协作能力。

探索云世界

456

任庆盛

2023-02-22

23158

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

23,158

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

PolarDB-X 开源 | 基于Paxos的MySQL三副本

大语言模型推理提速，TensorRT-LLM 高性能推理实践

7分钟玩转 AI 应用，函数计算一键部署 AI 生图大模型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI Infra之模型显存管理分析

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

「迁移急救包」全云平台无缝迁移云效实操手册

Flink CDC+Kafka 加速业务实时化

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

PolarDB-X 开源 | 基于Paxos的MySQL三副本

大语言模型推理提速，TensorRT-LLM 高性能推理实践

7分钟玩转 AI 应用，函数计算一键部署 AI 生图大模型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI Infra之模型显存管理分析

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

「迁移急救包」全云平台无缝迁移云效实操手册

Flink CDC+Kafka 加速业务实时化