人工智能平台 PAI的搜索结果_文章_第6页-阿里云开发者社区

wxchyy-39337

|

8月前

|

博文

|

强化学习:实践理解Markov决策过程(MDP)(干中学系列)——手把手教你入门强化学习(三)

本博客以实践为主，带领读者巩固上期关于“Markov决策过程”的核心概念。通过构建学生马尔可夫奖励模型、计算收获值与状态价值，进一步验证贝尔曼方程。详细介绍了转移概率、奖励值及策略概率的设置，并实现了均匀随机策略下的状态价值计算与最优策略的价值评估。结合代码实例，帮助读者深入理解强化学习理论。适合初学者实践与进阶学习。

# 人工智能平台 PAI # 机器学习/深度学习 # C++

wxchyy-39337

|

8月前

|

博文

|

来自：大数据与机器学习

强化学习:Markov决策过程(MDP)——手把手教你入门强化学习(二)

本文是“手把手教你入门强化学习”系列的第二篇，重点讲解了强化学习的核心数学模型——Markov决策过程（MDP）。文章从马尔可夫性质出发，逐步引入马尔可夫过程、马尔可夫奖励过程，最终深入到马尔可夫决策过程，详细解析了状态转移、奖励机制、价值函数及贝尔曼方程等关键概念。同时，文中还介绍了策略函数、最优价值函数等内容，并指出求解强化学习问题的关键在于寻找最优策略。通过理论推导与实践结合的方式，帮助读者更好地理解强化学习基础原理。

# 人工智能平台 PAI # 机器学习/深度学习 # 开发框架 # .NET # C++

wxchyy-39337

|

8月前

|

博文

|

来自：大数据与机器学习

强化学习：Gym的库的实践——小车上山(包含强化学习基础概念，环境配置国内镜像加速)——手把手教你入门强化学习（一）

本文开启“手把手教你入门强化学习”专栏，介绍强化学习基础概念及实践。强化学习通过智能体与环境交互，学习最优策略以最大化累积奖励，适用于复杂动态决策问题。文章讲解智能体、环境等核心概念，并使用Gym库进行案例实操，如CartPole和MountainCar环境的代码实现。最后预告下期将深入马尔科夫决策过程（MDP）。适合初学者系统了解强化学习并动手实践。创作不易，欢迎关注、点赞与收藏！

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # 算法 # 机器人 # 定位技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Chitu：清华核弹级开源！推理引擎3倍提速+50%省卡，国产芯片告别英伟达绑架

Chitu（赤兔）是清华大学与清程极智联合开源的高性能大模型推理引擎，支持多硬件适配，显著提升推理效率，适用于金融、医疗、交通等多个领域。

# 人工智能平台 PAI # 人工智能 # 自然语言处理 # 并行计算 # 芯片 # 异构计算

wxchyy-39337

|

8月前

|

博文

|

来自：大数据与机器学习

小白避坑指南：国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录（附镜像加速方案）

本文详细记录了使用Colossal-Ai对DeepSeek-Qwen模型进行微调的过程，包括模型下载、环境部署、数据集处理及代码实现等环节。重点介绍了LoRA低秩适配方法和Colossal-Ai分布式训练框架的使用技巧，解决了模型封装后函数调用冲突、梯度检查点配置等问题。通过命令行参数灵活调整训练配置，最终在两块A100 GPU上完成训练，单卡显存占用约11GB，利用率达85%。文章总结了常见问题及解决方法，为后续研究提供参考。

# 人工智能平台 PAI # 机器学习/深度学习 # 物联网 # PyTorch # API # 异构计算

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

MHA2MLA：0.3%数据微调！复旦团队开源推理加速神器，KV缓存狂降96.87%

MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效微调方法，通过引入多头潜在注意力机制（MLA），显著优化基于Transformer的LLM推理效率，降低推理成本。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # 缓存 # 关系型数据库 # MySQL

阿里云大数据Al技术

|

8月前

|

博文

|

来自：大数据与机器学习

DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

DistilQwen2.5 是阿里云人工智能平台 PAI 推出的全新蒸馏大语言模型系列。通过黑盒化和白盒化蒸馏结合的自研蒸馏链路，DistilQwen2.5各个尺寸的模型在多个基准测试数据集上比原始 Qwen2.5 模型有明显效果提升。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能，在较小参数规模下，显著降低了所需的计算资源和推理时长。阿里云的人工智能平台 PAI，作为一站式的机器学习和深度学习平台，对 DistilQwen2.5 模型系列提供了全面的技术支持。本文详细介绍在 PAI 平台使用 DistilQwen2.5 蒸馏小模型的全链路最佳实践。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # 边缘计算 # 算法 # 开发者

pai_rec_coder

|

8月前

|

博文

|

来自：大数据与机器学习

PAI-Rec推荐平台对于实时特征有三个层次

PAI-Rec推荐平台针对实时特征有三个处理层次：1) 离线模拟反推历史请求时刻的实时特征；2) FeatureStore记录增量更新的实时特征，模型特征导出样本准确性达99%；3) 通过callback回调接口记录请求时刻的特征。各层次确保了实时特征的准确性和时效性。

# 人工智能平台 PAI

阿里云大数据Al技术

|

8月前

|

博文

|

来自：大数据与机器学习

基于 Megatron 的多模态大模型训练加速技术解析

Pai-Megatron-Patch 是一款由阿里云人工智能平台PAI 研发的围绕英伟达 Megatron 的大模型训练配套工具，旨在帮助开发者快速上手大模型，打通大模型相关的高效分布式训练、有监督指令微调、下游任务评估等大模型开发链路。本文以 Qwen2-VL 为例，从易用性和训练性能优化两个方面介绍基于 Megatron 构建的 Pai-Megatron-Patch 多模态大模型训练的关键技术

# 云解析DNS # 人工智能平台 PAI # 编解码 # 人工智能 # 并行计算 # 网络性能优化 # 异构计算

阿里云大数据Al技术

|

8月前

|

博文

|

来自：大数据与机器学习

云上一键部署通义千问 QwQ-32B 模型，阿里云 PAI 最佳实践

3月6日阿里云发布并开源了全新推理模型通义千问 QwQ-32B，在一系列权威基准测试中，千问QwQ-32B模型表现异常出色，几乎完全超越了OpenAI-o1-mini，性能比肩Deepseek-R1，且部署成本大幅降低。并集成了与智能体 Agent 相关的能力，够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署 QwQ-32B，本实践带您部署体验专属 QwQ-32B模型服务。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 测试技术 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

人工智能平台 PAI