官方博客-第15页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

996

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

996

阿里云大数据Al技术

2024-05-15

78238

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,238

阿里云实时数仓Hologres

2024-05-15

75070

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,070

阿里云实时数仓Hologres

2024-07-23

25233

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云实时数仓Hologres

25,233

阿里云云原生

2024-07-30

3605

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

3,605

喻奎

2024-08-23

304

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

304

裘展

2024-11-07

1677

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,677

信徒

2024-12-05

837

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

837

正己

2025-01-06

338

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

338

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

【AAAI 2024】MuLTI：高效视频与语言理解

大数据分析平台之 OLAP 架构的最佳实践

分析性能提升40%，阿里云Hologres流量场景最佳实践

5 大场景上手通义灵码企业知识库问答

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

白话文讲解大模型｜ Attention is all you need

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

【AAAI 2024】MuLTI：高效视频与语言理解

大数据分析平台之 OLAP 架构的最佳实践

分析性能提升40%，阿里云Hologres流量场景最佳实践

5 大场景上手通义灵码企业知识库问答

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

白话文讲解大模型｜ Attention is all you need

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施