ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

421

ModelScope

2024-05-15

205

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

205

阿里云实时数仓Hologres

2024-06-18

1095

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

1,095

朱坪刘松伟赵世振

2024-07-01

21999

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

在 2024 年春节前夕，修正电商事业部面临了前所未有的技术挑战，修正将参与春晚的全民健康好礼派发的活动，且在央视及各大平台进行广告投放，预计流量激增至 16 亿，系统需要承载保底 5 万 QPS，目标 10 万 QPS。修正技术团队迫切需要升级 APP 架构以应对即将到来的超高并发场景。这一挑战不仅是对技术的考验，更是对修正品牌实力的一次展示。为了应对这次巨大的技术挑战，修正技术团队选择与阿里云云原生团队合作，进行 APP 架构的升级。

朱坪刘松伟赵世振等

21,999

阿里云实时数仓Hologres

2022-12-06

1243

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效。

阿里云实时数仓Hologres

1,243

喻奎

2023-06-25

10122

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,122

阿里云云原生

2024-05-15

113648

函数计算部署AI艺术字应用，生成新春文字头像

基于 Stable Diffusion Serverless API 解决方案搭建 AI 文字生成应用，支持并发出图。

阿里云云原生

113,648

探索云世界

2024-05-15

175580

阿里云 Serverless 异步任务处理系统在数据分析领域的应用

本文主要介绍异步任务处理系统中的数据分析，函数计算异步任务最佳实践-Kafka ETL，函数计算异步任务最佳实践-音视频处理等。

探索云世界

175,580

ModelScope

2024-05-15

244

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

244

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

联合XTuner，魔搭社区全面支持数据集的长文本训练

森马基于MaxCompute+Hologres+DataWorks构建数据中台

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

MaxCompute湖仓一体近实时增量处理技术架构揭秘

函数计算部署AI艺术字应用，生成新春文字头像

阿里云 Serverless 异步任务处理系统在数据分析领域的应用

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术