官方博客-第14页-阿里云开发者社区

ModelScope

2024-05-15

483

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

483

ModelScope

2024-05-15

715

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

715

张昕东

2024-07-25

14020

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,020

浅奕

2024-09-05

376

通过实验深入了解 TCP 连接的建立和关闭

TCP/IP 这个主题很多文章比较陈旧，且以讹传讹的东西太多，所以本文作者结合了理论和实践去写，旨在通过一系列实验帮助读者深入理解 TCP 连接的建立过程。

浅奕

376

烨陌

2024-09-05

371

软件测试之道 -- 做一个有匠心的程序员

作者一年前围绕设计模式与代码重构写了一篇《代码整洁之道 -- 告别码农，做一个有思想的程序员！》的文章。本文作为续篇，从测试角度谈程序员对软件质量的追求。

烨陌

371

赵世振

2024-12-25

2040

通义视觉推理大模型QVQ-72B-preview重磅上线

Qwen团队推出了新成员QVQ-72B-preview，这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色，尤其在数学推理任务中取得了显著进步。尽管如此，该模型仍存在一些局限性，仍在学习和完善中。

赵世振

2,040

赵世振

2025-01-08

1544

阿里云百炼xWaytoAGI共学课 DAY2 - 更好用的文本知识库应用跟学，快速上手阿里云百炼

本课程是阿里云百炼平台的第二天课程内容，旨在帮助用户了解如何通过阿里云百炼构建和发布自己的AI应用。介绍了如何利用大模型和智能体应用来创建具备强大语言理解和生成能力的AI助手，并通过不同的渠道（如网站、钉钉、微信公众号等）发布这些应用。

赵世振

1,544

阿里云开发者

2025-03-21

778

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

778

丕天

2025-03-21

1090

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,090

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

通过实验深入了解 TCP 连接的建立和关闭

软件测试之道 -- 做一个有匠心的程序员

通义视觉推理大模型QVQ-72B-preview重磅上线

阿里云百炼xWaytoAGI共学课 DAY2 - 更好用的文本知识库应用跟学，快速上手阿里云百炼

在IDEA中借助满血版 DeepSeek 提高编码效率

AI 推理场景的痛点和解决方案

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

通过实验深入了解 TCP 连接的建立和关闭

软件测试之道 -- 做一个有匠心的程序员

通义视觉推理大模型QVQ-72B-preview重磅上线

阿里云百炼xWaytoAGI共学课 DAY2 - 更好用的文本知识库应用跟学，快速上手阿里云百炼

在IDEA中借助满血版 DeepSeek 提高编码效率

AI 推理场景的痛点和解决方案