ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

406

澄潭董艺荃

2024-05-16

87958

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,958

资源编排ROS

2024-07-09

184

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

WordPress 是流行的开源CMS，阿里云的ROS（Resource Orchestration Service）提供模板化部署服务，简化云上环境如VPC、ECS、MySQL的创建。用户可通过ROS控制台选择模板一键部署WordPress，配置包括实例区、类型、系统盘及密码等参数。ROS模板定义了资源、参数和输出，自动处理依赖关系，实现云资源和应用的自动化部署。通过ROS，用户可以高效管理和更新整个资源栈，实现快速、可靠的云服务部署。

资源编排ROS

184

王奇

2023-06-26

8594

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置，分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题，解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践，介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

王奇

8,594

探索云世界

2024-05-15

2384

阿里云大降价后，再谈“降本增效”

2024年2月29日，阿里云宣布史上最大力度降价，引发行业对用云成本的热议。

探索云世界

2,384

ModelScope

2024-05-15

429

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

429

ModelScope

2024-05-15

192

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

192

偏左

2023-08-28

20801

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,801

周宇睿

2023-09-08

483

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

483

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

Hologres弹性计算在OLAP分析上的实践和探索

阿里云大降价后，再谈“降本增效”

元象大模型开源30款量化版本加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

MaxCompute半结构化数据思考与创新

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

Hologres弹性计算在OLAP分析上的实践和探索

阿里云大降价后，再谈“降本增效”

元象大模型开源30款量化版本 加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

MaxCompute半结构化数据思考与创新

元象大模型开源30款量化版本加速低成本部署丨附教程