官方博客-第20页-阿里云开发者社区

望宸

2025-02-20

660

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

660

澄潭计缘望宸

2025-03-14

984

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

984

以珩

2025-04-10

508

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

508

子葵于怀

2025-04-10

899

0代码将存量 API 适配 MCP 协议

本文主要讲述通过 Nacos+Higress 的方案实现0代码改造将 Agent 连接到存量应用，能够显著降低存量应用的改造成本。

子葵于怀

899

阿里云基础设施.

2025-05-01

382

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

382

闵子

2023-12-01

2876

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,876

ModelScope

2024-05-15

1205

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,205

阿里云实时数仓Hologres

2024-05-15

1019

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

1,019

元泊

2024-05-15

1035

SLS：使用 OTel 官方 SDK 采集 Android、iOS Trace 数据实践

本文介绍了使用 OTel 官方 SDK 采集 Android、iOS Trace 数据实践。

元泊

1,035

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

用自定义插件生成一篇图文并茂的文章

0代码将存量 API 适配 MCP 协议

ACK AI Profiling：从黑箱到透明的问题剖析

从浏览器原理出发聊聊Chrome插件

元象大模型开源30款量化版本加速低成本部署丨附教程

Flink+Paimon+Hologres 构建实时湖仓数据分析

SLS：使用 OTel 官方 SDK 采集 Android、iOS Trace 数据实践

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

用自定义插件生成一篇图文并茂的文章

0代码将存量 API 适配 MCP 协议

ACK AI Profiling：从黑箱到透明的问题剖析

从浏览器原理出发聊聊Chrome插件

元象大模型开源30款量化版本 加速低成本部署丨附教程

Flink+Paimon+Hologres 构建实时湖仓数据分析

SLS：使用 OTel 官方 SDK 采集 Android、iOS Trace 数据实践

元象大模型开源30款量化版本加速低成本部署丨附教程