ModelScope

2024-05-15

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

439

ModelScope

2024-05-15

421

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

421

ModelScope

2024-05-15

205

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

205

喻奎

2023-06-25

10122

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,122

ModelScope

2024-05-15

244

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

244

阿里云云原生

2024-05-15

62700

All in One：Prometheus 多实例数据统一管理最佳实践

当管理多个Prometheus实例时，阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案，两者在不同场景下各有优劣。

阿里云云原生

62,700

阿里云存储

2024-06-26

25655

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

本文介绍了AutoMQ基于Regional ESSD构建的十倍降本云原生，降低成本并提供无限容量，通过将存储层分离，使用ESSD作为WAL，OSS作为主存储，实现了成本降低和性能优化。此外，它利用弹性伸缩和抢占式实例，减少了70%的计算成本，并通过秒级分区迁移实现了高效弹性。而且，AutoMQ与Apache Kafka相比，能实现10倍成本优化和百倍弹性效率提升，且完全兼容Kafka API。

阿里云存储

25,655

玄飏

2024-07-04

36641

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

相较于 AliyunLogConfig，AliyunPipelineConfig 在配置格式、行为逻辑上做了很大改进，主打灵活、简单、稳定。点击本文，手把手教你如何配置 AliyunPipelineConfig，欢迎大家使用~

玄飏

36,641

休祯

2024-07-18

7600

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,600

类目筛选

内容类型

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

vLLM部署Yuan2.0：高吞吐、更便捷

联合XTuner，魔搭社区全面支持数据集的长文本训练

MaxCompute湖仓一体近实时增量处理技术架构揭秘

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

All in One：Prometheus 多实例数据统一管理最佳实践

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

流量回放新形态：基于网关 Access Log 发起