休祯

2024-07-18

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,604

喻奎

2023-06-25

10124

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,124

弃余

2023-08-11

857

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

857

ModelScope

2024-05-15

897

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

897

ModelScope

2024-05-15

103570

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

103,570

ModelScope

2024-05-15

206

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

206

ModelScope

2024-05-15

423

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

423

周新宇

2024-05-15

84219

AutoMQ：基于阿里云计算与存储产品实现云原生架构升级

AutoMQ[1] 是新一代基于共享存储架构实现的云原生 Kafka。得益于其存算分离的共享存储架构，通过和阿里云合作，深度使用阿里云可靠、先进的云服务如对象存储OSS、块存储 ESSD、弹性伸缩ESS以及抢占式实例实现了相比 Apache Kafka 10倍的成本优势并且提供了自动弹性的能力。

周新宇

84,219

阿里云云原生

2024-06-13

55570

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

55,570

类目筛选

内容类型

流量回放新形态：基于网关 Access Log 发起

MaxCompute湖仓一体近实时增量处理技术架构揭秘

Linux 内存管理新特性：Memory folios 解读

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

手把手教你捏一个自己的Agent

联合XTuner，魔搭社区全面支持数据集的长文本训练

vLLM部署Yuan2.0：高吞吐、更便捷

AutoMQ：基于阿里云计算与存储产品实现云原生架构升级

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署