官方博客-第20页-阿里云开发者社区

田双坤禹杨杨孙健翔

2024-05-15

101793

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,793

行疾

2024-05-15

3236

阿里云容器服务 ACK AI 助手正式上线

期待已久！阿里云容器服务 ACK AI 助手正式上线

行疾

3,236

阿里云大数据Al技术

2024-05-15

78230

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,230

ModelScope

2024-05-15

1131

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,131

自扬

2024-08-16

8750

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

本文从“空间”这一维度，聊一聊PolarDB-X在跨空间部署能力上的不断发展和延伸，以及在不同空间范围下的高可用和容灾能力，并着重介绍一下最新的产品能力——GDN(Global Database Network)。

自扬

8,750

裘展

2024-11-07

1669

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,669

牧思

2024-12-02

540

一行代码都不改，Golang 应用链路指标日志全知道

本文将通过阿里云开源的 Golang Agent，帮助用户实现“一行代码都不改”就能获取到应用产生的各种观测数据，同时提升运维团队和研发团队的幸福感。

牧思

540

望宸

2025-02-20

660

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

660

澄潭计缘望宸

2025-03-14

984

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

984

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

阿里云容器服务 ACK AI 助手正式上线

【AAAI 2024】MuLTI：高效视频与语言理解

LISA微调技术解析：比LoRA更低的显存更快的速度

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

白话文讲解大模型｜ Attention is all you need

一行代码都不改，Golang 应用链路指标日志全知道

大模型推理服务全景图

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

阿里云容器服务 ACK AI 助手正式上线

【AAAI 2024】MuLTI：高效视频与语言理解

LISA微调技术解析：比LoRA更低的显存更快的速度

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

白话文讲解大模型｜ Attention is all you need

一行代码都不改，Golang 应用链路指标日志全知道

大模型推理服务全景图

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要