官方博客-第12页-阿里云开发者社区

ModelScope

2024-05-15

980

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

980

阿里云大数据Al技术

2024-05-15

145507

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,507

探索云世界

2024-05-15

1324

使用CDN来加速OSS上存储的文件资源分发

本文为真实设备电商行业的实践，在网站有大量产品图片上传的场景下，用OSS配合CDN加速，提高了用户的访问速度、站点稳定性，并且提供了节省成本的思路。

探索云世界

1,324

元泊

2024-05-15

634

SLS：基于OTel的移动端全链路Trace建设思考和实践

本文探讨了移动端全链路Trace的建设思考和实践。

元泊

634

宝惜

2024-11-15

515

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

515

新念

2025-02-14

1464

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,464

澄潭计缘望宸

2025-03-14

1017

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,017

怀潜

2023-05-10

2890

Hologres+大模型初探，让ChatGPT回答商家问题

本文介绍基于Hologres+ChatGPT提供智能客服服务的实践。

怀潜

2,890

ModelScope

2024-05-15

767

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

767

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

使用CDN来加速OSS上存储的文件资源分发

SLS：基于OTel的移动端全链路Trace建设思考和实践

架构师的真内核

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Hologres+大模型初探，让ChatGPT回答商家问题

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

使用CDN来加速OSS上存储的文件资源分发

SLS：基于OTel的移动端全链路Trace建设思考和实践

架构师的真内核

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Hologres+大模型初探，让ChatGPT回答商家问题

联合XTuner，魔搭社区全面支持数据集的长文本训练