官方博客-第14页-阿里云开发者社区

新念

2025-02-14

1461

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,461

澄潭计缘望宸

2025-03-14

1014

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,014

怀潜

2023-05-10

2887

Hologres+大模型初探，让ChatGPT回答商家问题

本文介绍基于Hologres+ChatGPT提供智能客服服务的实践。

怀潜

2,887

杨永

2024-05-15

1506

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

1,506

ModelScope

2024-05-15

764

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

764

才胜南也

2024-09-05

1003

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

1,003

柯灵

2025-03-11

1601

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,601

别梦

2023-08-16

1208

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

MaxCompute推出新语法 - PIVOT/UNPIVOT：通过PIVOT关键字基于聚合将一个或者多个指定值的行转换为列；通过UNPIVOT关键字可将一个或者多个列转换为行。以更简洁易用的方式满足行转列和列转行的需求，简化了查询语句，提高了广大大数据开发者的生产力。

别梦

1,208

杨永

2024-05-15

93899

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,899

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Hologres+大模型初探，让ChatGPT回答商家问题

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

联合XTuner，魔搭社区全面支持数据集的长文本训练

RAG效果优化：高质量文档解析详解

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

使用KMS为MSE-Nacos敏感配置加密的最佳实践

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Hologres+大模型初探，让ChatGPT回答商家问题

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

联合XTuner，魔搭社区全面支持数据集的长文本训练

RAG效果优化：高质量文档解析详解

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

使用KMS为MSE-Nacos敏感配置加密的最佳实践