官方博客-第13页-阿里云开发者社区

ModelScope

2024-05-15

1942

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,942

ModelScope

2024-05-15

1124

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,124

明巍临城水德

2024-11-14

527

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

527

阿里云云原生

2025-02-25

1118

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,118

阿里云开发者

2025-04-24

1145

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,145

李德

2024-12-06

1334

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,334

望宸

2025-02-20

652

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

652

王明橙鲤黄俊

2024-05-15

64119

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,119

ModelScope

2024-05-15

1847

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,847

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

解锁 DeepSeek 安全接入、稳定运行新路径

为什么一定要做Agent智能体？

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

大模型推理服务全景图

通义千问开源模型在PAI灵骏的最佳实践

Multi-Agent实践第7期：智能体的高效协作

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

解锁 DeepSeek 安全接入、稳定运行新路径

为什么一定要做Agent智能体？

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

大模型推理服务全景图

通义千问开源模型在PAI灵骏的最佳实践

Multi-Agent实践第7期：智能体的高效协作

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理