官方博客-第18页-阿里云开发者社区

ModelScope

2024-05-15

1213

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,213

奶司

2024-05-15

1088

人人都是AI大师 - Prompt工程

prompt工程不需要复杂的编程知识，人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程，不涉及模型训练等内容。只讨论文本生成，不涉及图像等领域。

奶司

1,088

阿里云云原生

2024-05-15

73729

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

73,729

阿里云大数据Al技术

2024-08-09

9093

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,093

阿里云云原生

2024-08-12

460

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

460

元昌

2024-11-21

586

构建理想容器镜像——以CSI为例

本文围绕阿里云CSI（Container Storage Interface）镜像构建的实际案例，探讨了一系列优化容器镜像的最佳实践。

元昌

586

新念

2025-02-14

1393

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,393

尹斌斌周絮

2025-03-21

749

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

749

ModelScope

2024-05-15

712

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

712

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

人人都是AI大师 - Prompt工程

通义灵码技术解析，打造 AI 原生开发新范式

基于RAG搭建企业级知识库在线问答

5 大场景上手通义灵码企业知识库 RAG

构建理想容器镜像——以CSI为例

DeepSeek-V3 高效训练关键技术分析

解决隐式内存占用难题

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

人人都是AI大师 - Prompt工程

通义灵码技术解析，打造 AI 原生开发新范式

基于RAG搭建企业级知识库在线问答

5 大场景上手通义灵码企业知识库 RAG

构建理想容器镜像——以CSI为例

DeepSeek-V3 高效训练关键技术分析

解决隐式内存占用难题

联合XTuner，魔搭社区全面支持数据集的长文本训练