官方博客-第19页-阿里云开发者社区

ModelScope

2024-05-15

939

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

939

ModelScope

2024-05-15

1452

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

1,452

虎鸣

2024-05-15

780

Java 22 新增利器：使用 Java Stream Gather 优雅地处理流中的状态

本文中我们分析了什么是 “流”，对比了 Java 上几种常见的 “流”库，引入和详细介绍了 Java 22 中的 Stream Gather API 。同时也简单分享了利用虚拟线程如何简化 Stream map Concurrent操作符的实现。希望抛砖引玉和大家分享新的特性，共同进步。同时也希望大家都可以升级到新版本的 JDK，更好的赋能业务。

虎鸣

780

ModelScope

2024-05-15

1938

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,938

ModelScope

2024-05-15

1122

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,122

阿里云云原生

2024-08-22

19651

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

上海经证科技有限公司为有效推进软件项目管理和开发工作，选择了阿里云云效作为 DevOps 解决方案。通过云效，实现了从 0 开始，到现在近百个微服务、数百条流水线与应用交付的全面覆盖，有效支撑了敏捷开发流程。

阿里云云原生

19,651

枫桥

2025-02-07

500

从铜线到云端：网络技术的跨越与未来趋势

本文围绕物理网络和云网络基础知识科普进行展开，最后浅谈在AI大模型浪潮下云网络的演进方向。

枫桥

500

望宸

2025-02-20

648

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

648

亦达

2025-02-20

710

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

710

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

Java 22 新增利器：使用 Java Stream Gather 优雅地处理流中的状态

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

从铜线到云端：网络技术的跨越与未来趋势

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

Java 22 新增利器： 使用 Java Stream Gather 优雅地处理流中的状态

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

从铜线到云端：网络技术的跨越与未来趋势

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Java 22 新增利器：使用 Java Stream Gather 优雅地处理流中的状态