官方博客-第22页-阿里云开发者社区

ModelScope

2024-05-15

109983

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

109,983

ModelScope

2024-05-15

1113

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,113

澄潭董艺荃

2024-05-16

88528

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,528

在峰

2024-06-24

56440

解锁分布式云多集群统一监控的云上最佳实践

为应对分布式云多集群监控的挑战，阿里云可观测监控 Prometheus 版结合 ACK One，凭借高效纳管与全局监控方案有效破解了用户在该场景的监控运维痛点，为日益增长的业务需求提供了一站式、高效、统一的监控解决方案，实现成本与运维效率的双重优化。助力企业的数字化转型与业务快速增长，在复杂多变的云原生时代中航行，提供了一个强有力的罗盘与风帆。

在峰

56,440

龙蜥社区OpenAnolis

2024-07-05

699

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

ZOLOZ，视觉 AI 推理的算力和成本问题求解。

龙蜥社区OpenAnolis

699

阿里云云原生

2024-10-18

967

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

967

镭屿

2024-12-27

423

【硬核】C++11并发：内存模型和原子类型

本文从C++11并发编程中的关键概念——内存模型与原子类型入手，结合详尽的代码示例，抽丝剥茧地介绍了如何实现无锁化并发的性能优化。

镭屿

423

正己

2025-01-06

318

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

318

霜序

2025-01-20

607

ACK 容器监控存储全面更新：让您的应用运行更稳定、更透明

针对本地存储和 PVC 这两种容器存储使用方式，我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力，不仅对之前已有的监控大盘进行了优化，还针对不同的云存储类型，上线了全新的监控大盘，确保用户能够更好地理解和管理容器业务应用的存储资源。

霜序

607

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

解锁分布式云多集群统一监控的云上最佳实践

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

【硬核】C++11并发：内存模型和原子类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

ACK 容器监控存储全面更新：让您的应用运行更稳定、更透明

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

解锁分布式云多集群统一监控的云上最佳实践

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

【硬核】C++11并发：内存模型和原子类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

ACK 容器监控存储全面更新：让您的应用运行更稳定、更透明