ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

414

山泽

2024-05-15

351

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

351

资源编排ROS

2024-06-04

649

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

ChatTTS是一款针对对话场景的文本转语音模型，支持英中两种语言，训练数据超过10万小时。ChatTTS可通过WebUI和API访问。阿里云的资源编排服务(ROS)提供了一键部署ChatTTS到云端的方案，用户只需在ROS控制台配置模板参数，如区域和实例类型，即可完成部署。部署后，从资源栈输出获取ChatTTS服务地址。ROS利用IaC理念自动化部署云资源和应用，提高了部署效率和稳定性。

资源编排ROS

649

杨永

2024-05-15

264

利用 KMS 对文本信息进行签名验签实践

通过阿里云的KMS产品针对文件或者证书文件进行签名验签，可以有效解决攻击者针对敏感文件、重要文件在传输过程中被篡改，其次可以实现证书双向认证过程中的证书合法性校验，真正做到传输链路安全。

杨永

264

CloudImagine

2024-05-15

126

AIGC下一步：用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站，阿里云视频云演讲分享

CloudImagine

126

ModelScope

2024-05-15

198

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

198

木烟

2024-06-24

45748

多环境镜像晋级/复用最佳实践

本文介绍了在应用研发场景中，如何通过阿里云服务实现镜像构建部署的高效和安全。主要关注两个实践方法来确保“所发即所测”。

木烟

45,748

阿里云云原生

2024-07-29

163

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

163

喻奎

2023-06-25

10114

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,114

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

从零构建现代深度学习框架(TinyDL-0.01)

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

利用 KMS 对文本信息进行签名验签实践

AIGC下一步：用AI再度重构或优化媒体处理

联合XTuner，魔搭社区全面支持数据集的长文本训练

多环境镜像晋级/复用最佳实践

从供应商深度绑定，到走向真正的云原生，他们是这样做的

MaxCompute湖仓一体近实时增量处理技术架构揭秘