ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

369

木烟

2024-06-24

45722

多环境镜像晋级/复用最佳实践

本文介绍了在应用研发场景中，如何通过阿里云服务实现镜像构建部署的高效和安全。主要关注两个实践方法来确保“所发即所测”。

木烟

45,722

资源编排ROS

2019-12-24

1894

资源编排ROS之自定制资源（多云部署Terraform篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

1,894

ModelScope

2024-05-15

326

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

326

阿柄

2024-07-01

40304

5% 消耗，6 倍性能：揭秘新一代 iLogtail SPL 日志处理引擎与 Logstash 的 PK

在本文中，我们将深入探讨为何选择 iLogtail，以及它在 SPL 数据处理方面相较于 Logstash 有何独特优势。通过对比这两款工具的架构、性能以及功能，我们希望能够揭示 iLogtail 如何在日益复杂的日志处理需求中脱颖而出，帮助您做出明智的技术选择。

阿柄

40,304

云服务器ECS

2023-07-10

4153

一键配置版：搭建高可用的微信/支付宝小程序服务

本文提供在阿里云云服务器ECS上基于CentOS 7.9 64位操作系统搭建高可用的小程序服务端的指引。同时指导您在本地开发一个简单的微信/支付宝小程序——ECS小助手，通过远程调用部署在ECS上的服务端，实现在小程序中输入框输入ECS实例ID查询实例详细信息的功能。

云服务器ECS

4,153

ModelScope

2024-05-15

217

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

217

郑嘉扬何杉

2024-05-15

58765

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

享道出行利用阿里云容器服务ACK，结合AHPA智能弹性与ECS、ECI混合部署，解决了业务潮汐效应带来的弹性滞后和成本问题。

郑嘉扬何杉

58,765

ModelScope

2024-05-15

141

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

141

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

多环境镜像晋级/复用最佳实践

资源编排ROS之自定制资源（多云部署Terraform篇）

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

5% 消耗，6 倍性能：揭秘新一代 iLogtail SPL 日志处理引擎与 Logstash 的 PK

一键配置版：搭建高可用的微信/支付宝小程序服务

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了