人工智能平台PAI-最新-第3页-阿里云开发者社区-阿里云

游客am77kv7lfnvy2

|

问答

我用通义的实时记录有些文件我想删除但是不知道怎么操作，翻了半天，也找不到。怎么办？

276 0 0

阿里云大数据Al技术

|

数据采集人工智能自然语言处理

|

博文

DistillQwen-ThoughtY：通过变长思维链蒸馏，全面提升模型推理能力！

阿里云 PAI 团队基于 EasyDistill 框架，创新性地采用推理冗余度(RV)和认知难度(CD)双指标筛选机制，实现思维链与模型能力的精准匹配，发布新一代推理模型 DistillQwen-ThoughtY。相关模型和数据集已在 hugging face/ModelScope 等开源社区开放，配套 EasyDistill 框架支持高效知识蒸馏。近期内将推出 DistillQwen-ThoughtY 模型在 PAI-ModelGallery 的一键部署、训练和评测实践。

1198 2 2

阿里云大数据Al技术

|

人工智能监控测试技术

|

博文

云上AI推理平台全掌握 (1)：PAI-EAS LLM服务一键压测

在AI技术飞速发展的今天，大语言模型（LLM）、多模态模型等前沿技术正深刻改变行业格局。推理服务是大模型从“实验室突破”走向“产业级应用”的必要环节，需直面高并发流量洪峰、低延时响应诉求、异构硬件优化适配、成本精准控制等复杂挑战。阿里云人工智能平台 PAI 致力于为用户提供全栈式、高可用的推理服务能力。在本系列技术专题中，我们将围绕分布式推理架构、Serverless 弹性资源全球调度、压测调优和服务可观测等关键技术方向，展现 PAI 平台在推理服务侧的产品能力，助力企业和开发者在 AI 时代抢占先机，让我们一起探索云上 AI 推理的无限可能，释放大模型的真正价值！

825 2 2

阿里云大数据Al技术

|

数据采集自动驾驶 Java

|

博文

PAI-TurboX：面向自动驾驶的训练推理加速框架

PAI-TurboX 为自动驾驶场景中的复杂数据预处理、离线大规模模型训练和实时智能驾驶推理，提供了全方位的加速解决方案。PAI-Notebook Gallery 提供PAI-TurboX 一键启动的 Notebook 最佳实践

3694 2 2

rrc

|

人工智能

|

问答

百炼 AI 客服，怎么控制知识库联网召回网上切片？

431 1 0

阿里云大数据Al技术

|

机器学习/深度学习人工智能分布式计算

|

博文

Post-Training on PAI (1)：一文览尽开源强化学习框架在PAI平台的应用

Post-Training（即模型后训练）作为大模型落地的重要一环，能显著优化模型性能，适配特定领域需求。相比于 Pre-Training（即模型预训练），Post-Training 阶段对计算资源和数据资源需求更小，更易迭代，因此备受推崇。近期，我们将体系化地分享基于阿里云人工智能平台 PAI 在强化学习、模型蒸馏、数据预处理、SFT等方向的技术实践，旨在清晰地展现 PAI 在 Post-Training 各个环节的产品能力和使用方法，欢迎大家随时交流探讨。

1341 4 4

阿里云大数据Al技术

|

缓存人工智能负载均衡

|

博文

PAI 重磅发布模型权重服务，大幅降低模型推理冷启动与扩容时长

阿里云人工智能平台PAI 平台推出模型权重服务，通过分布式缓存架构、RDMA高速传输、智能分片等技术，显著提升大语言模型部署效率，解决模型加载耗时过长的业界难题。实测显示，Qwen3-32B冷启动时间从953秒降至82秒（降幅91.4%），扩容时间缩短98.2%。

802 1 2

阿里云大数据Al技术

|

机器学习/深度学习人工智能 JSON

|

博文

DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践

通过 PAI-ModelGallery，可一站式零代码完成 DistilQwen-ThoughtX 系列模型的训练、评测、压缩和部署。

623 0 0

ogk47bnjsz6yo

|

数据处理

|

问答

想做数据标注怎么接任务

290 1 0

阿里云大数据Al技术

|

人工智能自然语言处理算法

|

博文

DistilQwen-ThoughtX：变长思维链推理模型，能力超越DeepSeek蒸馏模型

阿里云PAI团队开发的 OmniThought 数据集，其中包含200万思维链，并标注了推理冗余度（RV）和认知难度（CD）分数。基于此数据集，我们还推出了 DistilQwen-ThoughtX 系列模型，可以通过RV和CD分数对思维链进行筛选，训练得到的模型获得根据问题和本身的认知能力，生成变长思维链的能力。同时在 EasyDistill 框架中开源了 OmniThought 数据集和 DistilQwen-ThoughtX 模型的全部权重。这些模型在性能上超过了 DeepSeek-R1-Distill 系列。

1481 9 9

阿里云大数据Al技术

|

机器学习/深度学习人工智能自然语言处理

|

博文

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

本文介绍了阿里云人工智能平台 PAI 推出的开源工具包 EasyDistill。随着大语言模型的复杂性和规模增长，它们面临计算需求和训练成本的障碍。知识蒸馏旨在不显著降低性能的前提下，将大模型转化为更小、更高效的版本以降低训练和推理成本。EasyDistill 框架简化了知识蒸馏过程，其具备多种功能模块，包括数据合成、基础和进阶蒸馏训练。通过数据合成，丰富训练集的多样性；基础和进阶蒸馏训练则涵盖黑盒和白盒知识转移策略、强化学习及偏好优化，从而提升小模型的性能。

2719 7 7

阿里云大数据Al技术

|

机器学习/深度学习人工智能自然语言处理

|

博文

Cosmos on PAI系列一：PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1

本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PAI 上进行快速部署使用。

774 3 3

aliyun4381607004

|

存储 JSON PyTorch

|

博文

Multimodal LLM训练-模型文件\训练数据加载逻辑源码分析

692 17 17

阿里云大数据Al技术

|

人工智能自然语言处理数据挖掘

|

博文

云上玩转Qwen3系列之三：PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用

PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用，通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中，为大模型提供了 MCP+OLAP 的智能数据分析能力，使用自然语言即可实现 OLAP 数据分析的查询效果，减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发，以满足特定场景的需求。

899 4 5

游客ydgr33tykllni

|

API

|

问答

通义万相-涂鸦作画 Http调用方式无法使用？

438 1 0

阿里云大数据Al技术

|

人工智能 JSON 算法

|

博文

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列，包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。

634 7 8

阿里云大数据Al技术

|

人工智能自然语言处理数据库

|

博文

云上玩转Qwen3系列之二：PAI-LangStudio搭建联网搜索和RAG增强问答应用

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 RAG 和联网搜索的 AI 智能问答应用。该应用通过将 RAG、web search 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中，为大模型提供了额外的联网搜索和特定领域知识库检索的能力，提升了智能回答的效果，减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发，以满足特定场景的需求。

1352 5 5

aliyun4381607004

|

缓存并行计算测试技术

|

博文

阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试

3135 12 12

aliyun4381607004

|

PyTorch 调度算法框架/工具

|

博文

阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析

DLC任务Pytorch launch_agent Socket Timeout问题源码分析与解决方案

708 18 18

Davidham3

|

并行计算 Python 容器

|

博文

uv找不到Python头文件的解决方案

最近在微调LLM的时候，我发现使用uv构建的环境，有时候会找不到Python.h，导致一些库报错，如`fatal error: Python.h: No such file or directory`。通过设置`python-preference`可以解决。

1114 35 35

阿里云大数据Al技术

|

人工智能自然语言处理运维

|

博文

Qwen3 全尺寸模型支持通过阿里云PAI-ModelGallery 一键部署

Qwen3 是 Qwen 系列最新一代的大语言模型，提供了一系列密集（Dense）和混合专家（MOE）模型。目前，PAI 已经支持 Qwen3 全系列模型一键部署，用户可以通过 PAI-Model Gallery 快速开箱！

1233 0 0

阿里云大数据Al技术

|

人工智能运维 API

|

博文

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit

4月27日，阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit，性能达到开源 SOTA。Step1X-Edit模型总参数量为19B，实现 MLLM 与 DiT 的深度融合，在编辑精度与图像保真度上实现大幅提升，具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力；支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中，Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型，比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持Step1X-Edit一键部署方案。

471 2 2

阿里云大数据Al技术

|

开发者

|

博文

云上玩转DeepSeek系列之六：DeepSeek云端加速版发布，具备超高推理性能

作为国内首个千亿级开源 MoE 模型，DeepSeek-R1 凭借其卓越的代码生成与复杂推理能力，已成为开发者构建智能应用的首选。然而，原始模型在产业落地中面临严峻挑战，部署 671B 满血版模型不仅硬件门槛要求很高，同时吞吐效率和响应延迟也受到了制约。PAI 正式推出了优化版 DeepSeek-R1 模型 DeepSeek-R1-PAI-optimized，将大模型推理效率推向了 Next Level。

744 11 11

阿里云大数据Al技术

|

数据采集人工智能大数据

|

博文

演讲实录：中小企业如何快速构建AI应用？

AI时代飞速发展，大模型和AI的应用创新不断涌现，面对百花齐放的AI模型，阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台，解决企业开发难、部署繁、成本高等一系列问题，让中小企业快速搭建AI应用。

1086 3 4

阿里云大数据Al技术

|

人工智能边缘计算前端开发

|

博文

人工智能平台 PAI DistilQwen2.5-DS3-0324发布：知识蒸馏+快思考=更高效解决推理难题

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列，包括DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。DistilQwen2.5-DS3-0324 系列模型是基于 DeepSeek-V3-0324 通过知识蒸馏技术并引入快思考策略构建，显著提升推理速度，使得在资源受限的设备和边缘计算场景中，模型能够高效执行复杂任务。实验显示，DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出，其32B模型效果接近参数量接近其10倍的闭源大模型。

1761 56 56

大风2016

|

Python 语音技术

|

问答

paraformer问题

737 1 0

zac37bvsbkhp6

|

问答

如何调用qwen-max实现溯源功能

516 1 0

aliyun9134026739

|

问答

创建数据集时无法导入word格式的文档

413 1 0

阿里云大数据Al技术

|

机器学习/深度学习人工智能 JSON

|

博文

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

阿里云的人工智能平台 PAI，作为一站式的机器学习和深度学习平台，对DistilQwen2.5-R1模型系列提供了全面的技术支持。无论是开发者还是企业客户，都可以通过 PAI-ModelGallery 轻松实现 Qwen2.5 系列模型的训练、评测、压缩和快速部署。本文详细介绍在 PAI 平台使用 DistilQwen2.5-R1 蒸馏模型的全链路最佳实践。

714 63 63

阿里云大数据Al技术

|

人工智能分布式计算大数据

|

博文

大数据& AI 产品月刊【2025年3月】

大数据& AI 产品技术月刊【2025年3月】，涵盖3月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

818 57 57

游客3hmdfuhkyqlwe

|

Java

|

问答

我在Java里使用langchain4j，搭建本地的RAG。

1102 1 0

阿里云大数据Al技术

|

人工智能边缘计算算法

|

博文

DistilQwen2.5-R1发布：知识蒸馏助推小模型深度思考

DistilQwen2.5-R1通过知识蒸馏技术，将大规模深度推理模型的知识迁移到小模型中，显著提升了小模型的推理能力。实验结果表明，DistilQwen2.5-R1在数学、代码和科学问题等多个基准测试中表现优异，尤其在7B参数量级上超越了其他开源蒸馏模型。本文将深入阐述 DistilQwen2.5-R1 的蒸馏算法、性能评估，并且提供在阿里云人工智能平台 PAI 上的使用指南及相关下载教程。

2438 64 64

阿里云大数据Al技术

|

人工智能自然语言处理运维

|

博文

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

PAI-Model Gallery 集成国内外 AI 开源社区中优质的预训练模型，涵盖了 LLM、AIGC、CV、NLP 等各个领域，用户可以通过 PAI 以零代码方式实现从训练到部署再到推理的全过程，获得更快、更高效、更便捷的 AI 开发和应用体验。现阿里云PAI-Model Gallery已同步接入DeepSeek-V3-0324、Qwen2.5-VL-32B-Instruct两大新模型，提供企业级部署方案。

854 16 16

ai老文

|

问答

使用大模型修改背景图片，图片已经上传到公网域名，https，使用minio，但是说下载失败

491 1 0

wxchyy-39337

|

机器学习/深度学习算法机器人

|

博文

强化学习:时间差分(TD)(SARSA算法和Q-Learning算法)(看不懂算我输专栏)——手把手教你入门强化学习(六)

本文介绍了时间差分法（TD）中的两种经典算法：SARSA和Q-Learning。二者均为无模型强化学习方法，通过与环境交互估算动作价值函数。SARSA是On-Policy算法，采用ε-greedy策略进行动作选择和评估；而Q-Learning为Off-Policy算法，评估时选取下一状态中估值最大的动作。相比动态规划和蒙特卡洛方法，TD算法结合了自举更新与样本更新的优势，实现边行动边学习。文章通过生动的例子解释了两者的差异，并提供了伪代码帮助理解。

1197 2 2

阿里云大数据Al技术

|

人工智能 JSON 自然语言处理

|

博文

如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介

阿里云人工智能平台 PAI 推出 PAI-Judge 裁判员大模型，为用户构建符合应用场景的多维度、细粒度的评测体系，支持单模型评测和双模型竞技两种模式，允许用户自定义参数，实现准确、灵活、高效的模型自动化评测，为模型迭代优化提供数据支撑。相比通用大模型尤其在回答确定性/数学类问题、角色扮演、创意文体写作、翻译等场景下，PAI-Judge 系列模型表现优异，可以直接用于大模型的评估与质检。

1725 8 8

n7m5rpxebzapk

|

问答

请问如何在微软的Autogen 0.4框架下使用Qwen模型实现工具调用？

1200 1 0

wxchyy-39337

|

机器学习/深度学习存储算法

|

博文

强化学习:蒙特卡罗求解最优状态价值函数——手把手教你入门强化学习(五)

本文介绍了强化学习中的蒙特卡罗算法，包括其基本概念、两种估值方法（首次访问蒙特卡罗与每次访问蒙特卡罗）及增量平均优化方式。蒙特卡罗法是一种基于完整回合采样的无模型学习方法，通过统计经验回报的平均值估计状态或动作价值函数。文章详细讲解了算法流程，并指出其初期方差较大、估值不稳定等缺点。最后对比动态规划，说明了蒙特卡罗法在强化学习中的应用价值。适合初学者理解蒙特卡罗算法的核心思想与实现步骤。

992 4 4

wxchyy-39337

|

机器学习/深度学习算法关系型数据库

|

博文

强化学习:动态规划求解最优状态价值函数——手把手教你入门强化学习(四)

本文介绍了基于模型的强化学习算法，重点讲解动态规划（DP）。动态规划通过分解问题为子问题求解状态价值函数，利用贝尔曼期望方程迭代更新。其核心性质包括最优子结构和重叠子问题，适用于已知转移概率和奖励的MDP场景。文章回顾了前期强化学习基础，并展望了后续内容如蒙特卡罗法。适合初学者系统了解强化学习算法原理与应用。

736 7 7

wxchyy-39337

|

机器学习/深度学习 C++

|

博文

强化学习:实践理解Markov决策过程(MDP)(干中学系列)——手把手教你入门强化学习(三)

本博客以实践为主，带领读者巩固上期关于“Markov决策过程”的核心概念。通过构建学生马尔可夫奖励模型、计算收获值与状态价值，进一步验证贝尔曼方程。详细介绍了转移概率、奖励值及策略概率的设置，并实现了均匀随机策略下的状态价值计算与最优策略的价值评估。结合代码实例，帮助读者深入理解强化学习理论。适合初学者实践与进阶学习。

764 63 63

wxchyy-39337

|

机器学习/深度学习开发框架 .NET

|

博文

强化学习:Markov决策过程(MDP)——手把手教你入门强化学习(二)

本文是“手把手教你入门强化学习”系列的第二篇，重点讲解了强化学习的核心数学模型——Markov决策过程（MDP）。文章从马尔可夫性质出发，逐步引入马尔可夫过程、马尔可夫奖励过程，最终深入到马尔可夫决策过程，详细解析了状态转移、奖励机制、价值函数及贝尔曼方程等关键概念。同时，文中还介绍了策略函数、最优价值函数等内容，并指出求解强化学习问题的关键在于寻找最优策略。通过理论推导与实践结合的方式，帮助读者更好地理解强化学习基础原理。

1011 4 4

wxchyy-39337

|

机器学习/深度学习人工智能算法

|

博文

强化学习：Gym的库的实践——小车上山(包含强化学习基础概念，环境配置国内镜像加速)——手把手教你入门强化学习（一）

本文开启“手把手教你入门强化学习”专栏，介绍强化学习基础概念及实践。强化学习通过智能体与环境交互，学习最优策略以最大化累积奖励，适用于复杂动态决策问题。文章讲解智能体、环境等核心概念，并使用Gym库进行案例实操，如CartPole和MountainCar环境的代码实现。最后预告下期将深入马尔科夫决策过程（MDP）。适合初学者系统了解强化学习并动手实践。创作不易，欢迎关注、点赞与收藏！

1974 4 5

wxchyy-39337

|

机器学习/深度学习物联网 PyTorch

|

博文

小白避坑指南：国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录（附镜像加速方案）

本文详细记录了使用Colossal-Ai对DeepSeek-Qwen模型进行微调的过程，包括模型下载、环境部署、数据集处理及代码实现等环节。重点介绍了LoRA低秩适配方法和Colossal-Ai分布式训练框架的使用技巧，解决了模型封装后函数调用冲突、梯度检查点配置等问题。通过命令行参数灵活调整训练配置，最终在两块A100 GPU上完成训练，单卡显存占用约11GB，利用率达85%。文章总结了常见问题及解决方法，为后续研究提供参考。

1194 15 15

阿里云大数据Al技术

|

机器学习/深度学习人工智能边缘计算

|

博文

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

DistilQwen2.5 是阿里云人工智能平台 PAI 推出的全新蒸馏大语言模型系列。通过黑盒化和白盒化蒸馏结合的自研蒸馏链路，DistilQwen2.5各个尺寸的模型在多个基准测试数据集上比原始 Qwen2.5 模型有明显效果提升。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能，在较小参数规模下，显著降低了所需的计算资源和推理时长。阿里云的人工智能平台 PAI，作为一站式的机器学习和深度学习平台，对 DistilQwen2.5 模型系列提供了全面的技术支持。本文详细介绍在 PAI 平台使用 DistilQwen2.5 蒸馏小模型的全链路最佳实践。

829 3 3

pai_rec_coder

|

博文

PAI-Rec推荐平台对于实时特征有三个层次

PAI-Rec推荐平台针对实时特征有三个处理层次：1) 离线模拟反推历史请求时刻的实时特征；2) FeatureStore记录增量更新的实时特征，模型特征导出样本准确性达99%；3) 通过callback回调接口记录请求时刻的特征。各层次确保了实时特征的准确性和时效性。

816 0 0

游客v3weoo53xvn4o

|

API 开发工具

|

问答

百炼平台的API总是报错没有权限。

855 2 0

阿里云大数据Al技术

|

编解码人工智能并行计算

|

博文

基于 Megatron 的多模态大模型训练加速技术解析

Pai-Megatron-Patch 是一款由阿里云人工智能平台PAI 研发的围绕英伟达 Megatron 的大模型训练配套工具，旨在帮助开发者快速上手大模型，打通大模型相关的高效分布式训练、有监督指令微调、下游任务评估等大模型开发链路。本文以 Qwen2-VL 为例，从易用性和训练性能优化两个方面介绍基于 Megatron 构建的 Pai-Megatron-Patch 多模态大模型训练的关键技术

2081 8 8

阿里云大数据Al技术

|

机器学习/深度学习人工智能自然语言处理

|

博文

云上一键部署通义千问 QwQ-32B 模型，阿里云 PAI 最佳实践

3月6日阿里云发布并开源了全新推理模型通义千问 QwQ-32B，在一系列权威基准测试中，千问QwQ-32B模型表现异常出色，几乎完全超越了OpenAI-o1-mini，性能比肩Deepseek-R1，且部署成本大幅降低。并集成了与智能体 Agent 相关的能力，够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署 QwQ-32B，本实践带您部署体验专属 QwQ-32B模型服务。

2470 17 17

游客se5jtsmqlf5l2

|

问答

智能助理无法正确进行智能表单填报

360 0 0

游客vipehuwq7b4mq

|

问答

智能体知识库问题

386 1 0

人工智能平台PAI

最新

博文

免费试用

问答

学习

电子书

视频

体验

活动

我用 通义 的实时记录 有些文件 我想删除 但是不知道怎么操作 ，翻了半天，也找不到。怎么办？

DistillQwen-ThoughtY：通过变长思维链蒸馏，全面提升模型推理能力！

云上AI推理平台全掌握 (1)：PAI-EAS LLM服务一键压测

PAI-TurboX：面向自动驾驶的训练推理加速框架

百炼 AI 客服，怎么控制知识库联网召回网上切片？

Post-Training on PAI (1)：一文览尽开源强化学习框架在PAI平台的应用

PAI 重磅发布模型权重服务，大幅降低模型推理冷启动与扩容时长

DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践

想做数据标注怎么接任务

DistilQwen-ThoughtX：变长思维链推理模型，能力超越DeepSeek蒸馏模型

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

Cosmos on PAI系列一：PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1

Multimodal LLM训练-模型文件\训练数据加载逻辑源码分析

云上玩转Qwen3系列之三：PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用

通义万相-涂鸦作画 Http调用方式无法使用？

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

云上玩转Qwen3系列之二：PAI-LangStudio搭建联网搜索和RAG增强问答应用

阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试

阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析

uv找不到Python头文件的解决方案

Qwen3 全尺寸模型支持通过阿里云PAI-ModelGallery 一键部署

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit

云上玩转DeepSeek系列之六：DeepSeek云端加速版发布，具备超高推理性能

演讲实录：中小企业如何快速构建AI应用？

人工智能平台 PAI DistilQwen2.5-DS3-0324发布：知识蒸馏+快思考=更高效解决推理难题

paraformer问题

如何调用qwen-max实现溯源功能

创建数据集时无法导入word格式的文档

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

大数据& AI 产品月刊【2025年3月】

我在Java里使用langchain4j，搭建本地的RAG。

DistilQwen2.5-R1发布：知识蒸馏助推小模型深度思考

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

使用大模型修改背景图片，图片已经上传到公网域名，https，使用minio，但是说下载失败

强化学习:时间差分(TD)(SARSA算法和Q-Learning算法)(看不懂算我输专栏)——手把手教你入门强化学习(六)

如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介

请问如何在微软的Autogen 0.4框架下使用Qwen模型实现工具调用？

强化学习:蒙特卡罗求解最优状态价值函数——手把手教你入门强化学习(五)

强化学习:动态规划求解最优状态价值函数——手把手教你入门强化学习(四)

强化学习:实践理解Markov决策过程(MDP)(干中学系列)——手把手教你入门强化学习(三)

强化学习:Markov决策过程(MDP)——手把手教你入门强化学习(二)

强化学习：Gym的库的实践——小车上山(包含强化学习基础概念，环境配置国内镜像加速)——手把手教你入门强化学习（一）

小白避坑指南：国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录（附镜像加速方案）

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

PAI-Rec推荐平台对于实时特征有三个层次

百炼平台的API总是报错没有权限。

基于 Megatron 的多模态大模型训练加速技术解析

云上一键部署通义千问 QwQ-32B 模型，阿里云 PAI 最佳实践

智能助理无法正确进行智能表单填报

智能体知识库问题

活跃用户

相关产品

我用通义的实时记录有些文件我想删除但是不知道怎么操作，翻了半天，也找不到。怎么办？