官方博客-第34页-阿里云开发者社区

ModelScope

2024-05-15

109979

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

109,979

ModelScope

2024-05-15

1109

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,109

阿里云云原生

2024-08-12

467

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

467

邢云阳

2024-08-20

19102

AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。

邢云阳

19,102

穹谷

2024-09-02

852

ARMS RUM 是阿里云应用实时监控服务（ARMS）下的用户体验监控（RUM）产品，覆盖 Web/H5、各类平台小程序、Android、iOS、Flutter、ReactNative、Windows、macOS 等平台框架。接入 SDK 后会主动采集端侧页面性能、资源加载、API 调用、异常崩溃、卡顿、用户操作、系统信息等数据，还支持事件、日志、异常等数据按需自定义上报以满足业务数据分析需求，提供全面的性能分析、异常分析、产品分析、会话分析能力，帮助快速跟踪定位问题原因，提升产品用户使用体验。

穹谷

852

阿里云云原生

2024-09-06

292

MacTalk 测评通义灵码，实现“微信表情”小功能

墨问西东创始人池建强分享了团队使用通义灵码的经验。

阿里云云原生

292

阿里云云原生

2024-10-22

418

ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用

本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用》。

阿里云云原生

418

阿里云云原生

2025-01-07

270

Envoy 开启 HTTP2 后偶现 404 解决方法

在大部分基于 Envoy 实现的网关里，都存在这样一个问题，当开启 http2 时，客户端访问会出现偶发的 404，并且可以从日志注意到这些 404 的请求，:authority 头里的域名和 SNI 里的域名不一致。且在使用泛域名证书，且配置了多个域名的路由的情况下，这个问题特别容易出现。

阿里云云原生

270

有松

2025-01-16

310

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

310

官方博客-第34页-阿里云开发者社区

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

LISA微调技术解析：比LoRA更低的显存更快的速度

5 大场景上手通义灵码企业知识库 RAG

AI 网关零代码解决 AI 幻觉问题

每个端侧产品都需要的用户体验监控

MacTalk 测评通义灵码，实现“微信表情”小功能

ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用

Envoy 开启 HTTP2 后偶现 404 解决方法

AI 场景下，函数计算 GPU 实例模型存储最佳实践

官方博客-第34页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

LISA微调技术解析：比LoRA更低的显存更快的速度

5 大场景上手通义灵码企业知识库 RAG

AI 网关零代码解决 AI 幻觉问题

每个端侧产品都需要的用户体验监控

MacTalk 测评通义灵码，实现“微信表情”小功能

ApsaraMQ Serverless 能力再升级，事件驱动架构赋能 AI 应用

Envoy 开启 HTTP2 后偶现 404 解决方法

AI 场景下，函数计算 GPU 实例模型存储最佳实践