ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

372

弃余

2023-08-11

810

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

810

子丑

2024-06-13

64954

基于 Nginx Ingress + 云效 AppStack 实现灰度发布

本文将演示结合云效 AppStack，来看下如何在阿里云 ACK 集群上进行应用的 Ingress 灰度发布。

子丑

64,954

阿里云大数据Al技术

2024-05-15

144813

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

144,813

阿里云云原生

2024-05-15

78704

让研发规范管得住，在流水线之上做研发流程

研发规范的目标，是为了解决或降低出现软件危机的风险。但传统流水线受限于工具的定位，无法解决研发规范的落地问题，需要在更高的层面来解决。阿里云云效团队经过内部启发后推出的新产品：云效应用交付平台 AppStack 给出了解决方案，快来使用体验吧！

阿里云云原生

78,704

ModelScope

2024-05-15

142

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

142

刘军

2024-06-18

16553

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

本文展示了 Dubbo3 triple 协议是如何简化从协议规范与实现上简化开发测试、入口流量接入成本的，同时提供高性能通信、面向接口的易用性编码。

刘军

16,553

ModelScope

2024-05-15

326

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

326

ModelScope

2024-05-15

217

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

217

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Linux 内存管理新特性：Memory folios 解读

基于 Nginx Ingress + 云效 AppStack 实现灰度发布

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

让研发规范管得住，在流水线之上做研发流程

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术