人工智能平台PAI-阿里云开发者社区-阿里云

开发者社区> 大数据与机器学习> 人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

今日

3411

内容

活动

3894

关注

来自：大数据与机器学习

活动

傲海

机器学习/深度学习算法对象存储

博文

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

伴随着今日阿里云机器学习PAI在云栖大会的重磅发布，快来感受下人工智能的魅力。一、背景随着互联网的发展，产生了大量的图片以及语音数据，如何对这部分非结构化数据行之有效的利用起来，一直是困扰数据挖掘工程师的一到难题。

51016 71 143

傲海

机器学习/深度学习自然语言处理算法

博文

【玩转数据系列六】文本分析算法实现新闻自动分类

新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式，消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标，完全由机器智能化实现。

20223 1 3

傲海

机器学习/深度学习 SQL 分布式计算

博文

【玩转数据系列一】人口普查统计案例

玩转数据系列文章通过简单地案例搭建，介绍如何通过阿里云机器学习平台进行数据挖掘。

17651 3 3

傲海

算法机器学习/深度学习数据处理

博文

【玩转数据系列三】利用图算法实现金融行业风控

本文将针对阿里云平台上图算法模块来进行实验。图算法一般被用来解决关系网状的业务场景。与常规的结构化数据不同，图算法需要把数据整理成首尾相连的关系图谱。图算法更多的是考虑边和点的概念。阿里云机器学习平台上提供了丰富的图算法组件，包括K-Core、最大联通子图、标签传播聚类等。

14707 3 8

傲海

机器学习/深度学习算法搜索推荐

博文

基于对象特征的推荐

（本实验选用数据为真实电商脱敏数据，仅用于学习，请勿商用）在上一期基于协同过滤的的推荐场景中，我们介绍了如何通过PAI快速搭建一个基于协同过滤方案的推荐系统，这一节会介绍一些如何基于推荐对象特征的推荐方法。

12188 1 3

傲海

机器学习/深度学习算法对象存储

博文

机器学习PAI全新功效——实时新闻热点Online Learning实践

(本实验会用到流式机器学习算法，正处于邀测状态，需要申请开通)PAI地址：https://data.aliyun.com/product/learn流式机器学习算法申请：https://data.aliyun.com/paionlinelearning打开新闻客户端，往往会收到热点新闻推送相关的内容。

15289 0 0

傲海

机器学习/深度学习算法搜索推荐

博文

【玩转数据系列五】农业贷款发放预测

很多农民因为缺乏资金，在每年耕种前会向相关机构申请贷款来购买种地需要的物资，等丰收之后偿还。农业贷款发放问题是一个典型的数据挖掘问题。贷款发放人通过往年的数据，包括贷款人的年收入、种植的作物种类、历史借贷信息等特征来构建经验模型，通过这个模型来预测受贷人的还款能力。

12173 2 3

傲海

机器学习/深度学习数据采集算法

博文

【玩转数据系列七】有娃的注意了，机器学习教您如何提高孩子学习成绩

母亲是老师反而会对孩子的学习成绩造成不利影响？能上网的家庭，孩子通常能取得较好的成绩？影响孩子成绩的最大因素居然是母亲的学历？本文通过机器挖掘算法和中学真实的学生数据为您揭秘影响中学生学业的关键因素有哪些。

10747 0 3

傲海

算法

博文

FM算法介绍

概述 FM (Factorization Machine) 算法可进行回归和二分类预测，它的特点是考虑了特征之间的相互作用，是一种非线性模型，目前FM算法是推荐领域被验证的效果较好的推荐方案之一，在诸多电商、广告、直播厂商的推荐领域有广泛应用。

13076 0 2

傲海

机器学习/深度学习人工智能算法

博文

【上报纸啦】95后大学生用机器学习PAI大战老年痴呆

中国青年报原文链接：http://zqb.cyol.com/html/2017-07/28/nw.D110000zgqnb_20170728_2-06.htm 燕山大学信息科学与技术专业出身的95后大学生谭创创，没想到自己会与阿尔茨海默症（俗称“老年痴呆症”）为“敌”。

9285 1 1

傲海

机器学习/深度学习算法语音技术

博文

【玩转数据系列十六】机器学习PAI通过声音分辨男女（含语音特征提取相关数据和代码）

机器学习PAI通过声音数据分辨男女（含语音特征提取相关数据和代码）

8835 1 1

李博garvin1

博文

新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式，消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标，完全由机器智能化实现。 数据源:网络爬取新闻数据 数据大小:261 KB 字段数量:3 使用组件:过滤与映射,SQL脚本,读数据表,增加序号列,类型转换

5557 0 1

YuuuZeee

搜索推荐

博文

【数据科学老司机在线教学第二期】阿里云大数据生态协同过滤推荐系统实战

人工智能千千万，没法落地都白干。自从上次老司机用神经网络训练了热狗识别模型以后，群众们表示想看一波更加接地气，最好是那种能10分钟上手，一辈子受用的模型。这次，我们就通过某著名电商公司的公开数据集，在阿里云大数据生态之下快速构建一个基于协同过滤的推荐系统！

5714 0 0

傲海

新零售机器学习/深度学习算法

博文

【玩转数据系列十七】机器学习实现双十一购物清单的自动商品标签归类

4151 0 0

shequ

博文

人民的名义分析

人民的名义台本分析 数据源:人民的名义台本 数据大小:77.8 KB 字段数量:2 使用组件:读数据表

4557 0 7

Jacker

机器学习/深度学习算法搜索推荐

博文

打击黑灰产的利器 —— 图神经网络（GNN）

阿里巴巴安全部数据与算法团队一直致力于与黑灰产进行对抗，保障用户在淘宝、天猫、闲鱼等平台上的使用体验和切身利益。面对狡猾的黑灰产，我们研究出了一系列算法武器，图神经网络（GNN）是其中重要的防控技术。本文结合阿里开源GNN框架Graph-Learn（https://github.com/alibaba/graph-learn）进行介绍。

4602 1 1

傲海

算法

博文

ALS算法实现用户音乐打分预测

很多人在决定是否看一部电影之前都会去豆瓣看下评分作为参考，看完电影也会给一个自己的分数。每个人对每个商品或者电影或是音乐都有一个心理的分数，这个分数标明用户是否对这个内容满意。作为内容的提供方，如果可以预测出每个用户对于内容的心理分数，就能更好的理解用户，并给用户提供好的内容推荐。

4109 2 5

YuuuZeee

博文

利用PAI-DSW访问Github, 快速获取最新的学习资源

PAI-DSW（Data science workshop）是专门为数据科学探索者们准备的云端深度学习开发环境，用户可以登录 DSW 进行代码的开发并运行工作。目前 DSW 支持了Github下载，让我们可以更加便捷的访问上面的资源.

5672 0 1

YuuuZeee

机器学习/深度学习

博文

电网用户窃电识别

传统的防窃漏电方法主要通过定期巡检、定期校验电表、用户举报窃电等方法来发现窃电或计量装置故障。但这种方法对人的依赖性太强，抓窃查漏的目标不明确。目前，很多供电局主要通过工作人员利用计量异常报警功能和电能量数据查询功能开展用户用电情况的在线监控工作，通过采集电量异常、负荷异常、终端报警、主站报警、线损异常等信息监测窃漏电情况和发现计量装置的故障。

2457 0 1

李博garvin1

博文

农业贷款预测

很多农民因为缺乏资金，在每年耕种前会向相关机构申请贷款来购买种地需要的物资，等丰收之后偿还。农业贷款发放问题是一个典型的数据挖掘问题。贷款发放人通过往年的数据，包括贷款人的年收入、种植的作物种类、历史借贷信息等特征来构建经验模型，通过这个模型来预测受贷人的还款能力。 数据源:UCI开源数据 数据大小:6.62 KB 字段数量:10 使用组件:过滤与映射,SQL脚本,读数据表,线性回归(旧),合并列

1313 0 0

李博garvin1

博文

心脏病预测案例_1480

主要针对，心脏病预测，具体的场景具体访问中阐述 数据源:预测数据 数据大小:7.49 KB 字段数量:15 使用组件:归一化,拆分,SQL脚本,读数据表,类型转换

1098 0 0

小倩立正向

算法

博文

【推荐算法】商品推荐_3054

test 数据源: 数据大小:328 KB 字段数量:4 使用组件:过滤与映射,SQL脚本,读数据表,JOIN

1081 0 0

228387087934150290

算法

博文

【推荐算法】商品推荐_3041

asdfsadf eee 数据源: 数据大小:328 KB 字段数量:4 使用组件:读数据表,SQL脚本,JOIN,过滤与映射

1186 0 0

星月之寂

博文

文本分类

文本分析实验 数据源: 数据大小:261 KB 字段数量:3 使用组件:拆分,SQL脚本,读数据表,JOIN,增加序号列,类型转换,合并列

1122 0 0

翠

博文

test_etrec

etrec 数据源:etrec 数据大小:1.03 KB 字段数量:4 使用组件:读数据表

1148 0 0

翠

博文

雾霾天气预测_56

雾霾天气预测 数据源:雾霾天气预测 数据大小:37.3 KB 字段数量:7 使用组件:归一化,拆分,SQL脚本,读数据表,类型转换

1037 0 0

1927894408513719

算法

博文

【推荐算法】商品推荐_1450

测试一下功能 数据源: 数据大小:328 KB 字段数量:4 使用组件:过滤与映射,SQL脚本,读数据表,JOIN

1058 0 0

翠

博文

del

123 数据源:123 数据大小:7.22 KB 字段数量:16 使用组件:读数据表

914 0 0

puxuefei

算法

博文

农业贷款预测的回归算法实现_884

农业数据挖掘 数据源: 数据大小:3.41 KB 字段数量:10 使用组件:SQL脚本,读数据表,模型

978 0 0

子德

博文

人口普查统计案例_3584

这是一个测试请删掉 数据源: 数据大小:584 KB 字段数量:15 使用组件:读数据表,SQL脚本,过滤与映射

1123 0 0

辉空静寂

博文

CTR_GBDT_LR_TEST

CTR中的GBDT+LR融合方案 数据源:internet 数据大小:770 KB 字段数量:20 使用组件:拆分,读数据表,特征编码

941 0 0

游客a33iifhc5zd4g

7月前

Python Windows

博文

Miniconda 安装与环境配置全流程图解（2025 最新版）

Miniconda 可以看作是 Anaconda 的“轻装版”，只自带 conda 包管理器与基础的 Python 运行时。它体积小、部署速度快，特别适合按需创建与管理虚拟环境的用户。与 Anaconda 相比，Miniconda 不会预先安装一大堆科学计算库，你可以根据项目需求再单独选择、安装需要的包，因此整体更轻巧、更灵活。本文将手把手演示在 Windows 下安装 Miniconda 的全过程：从下载安装器、完成向导配置、设置环境变量，到最后的基础验证与简单示例，帮助你迅速把 Miniconda 用起来。

9335 12 14

jz_test

算法

博文

【推荐算法】商品推荐_2587

asdf 数据源:adsf 数据大小:328 KB 字段数量:4 使用组件:Filter and Mapping,JOIN,Read ODPS table,SQL Script

898 0 0

拂尘

博文

predict_with_binary_class_log

GBDT 数据源: 数据大小:7.49 KB 字段数量:15 使用组件:拆分,SQL脚本,读数据表,标准化,类型转换

800 0 0

游客bumz3yihrv5m2

1天前

人工智能安全 Linux

博文

5 分钟搞定 Hermes 部署 Windows 整合包实操详解

本文为Windows用户打造Hermes Agent零基础部署指南：无需Python/Linux经验，5分钟完成下载、解压、启动、自动配置四步操作，实现本地AI智能体一键运行。支持离线使用、文件自动化与办公辅助，安全可靠，新手友好。

310 0 1

游客gzxm6hvj64l2w

1天前

JSON 自然语言处理前端开发

博文

谷歌深夜发布 Gemini 3.5：多模态能力再升级，开发者该怎么抓住这波机会？

Gemini 3.5 Flash于2026年5月发布，主打原生多模态与实时智能体能力：支持图文音视一体化理解、帧级视频诊断、100万token长上下文，并在编码（76.2%）、Agent任务（83.6%）等实测中超越前代。速度快4倍、成本更低，已免费开放。

360 1 1

BugShare

4月前

人工智能 API 数据安全/隐私保护

博文

如何使用 LiteLLM 网关代理统一管理你的大模型

大模型使用混乱？费用失控、切换成本高、权限难管？LiteLLM 是轻量实用的大模型网关，统一 OpenAI 兼容接口，纳管 OpenAI、Qwen、本地 vLLM/Ollama 等多源模型。支持 Docker Compose 一键部署、虚拟 Key 权限控制、预算限额与全链路可观测性，业务代码零改造即可接入。

3113 8 10

阿里云大数据Al技术

人工智能分布式计算大数据

博文

AI Native平台，跨越AI应用从创新到生产的鸿沟

2024年是AI应用的元年，以大模型为中心的 AI Native 应用大爆发正在从理想变成现实。云计算带来的应用创新潮，经历了虚拟机时代和云原生时代，正在全面拥抱以大模型为核心的 AI Native 阶段，推动大数据与AI的工作流前所未有地紧密结合。领先大模型、高效的AI计算平台和统一的大数据平台是 AI Native 应用广泛落地背后不可获缺的要素。 9月20日，2024云栖大会上，阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布大数据AI平台全面升级，为 AI Native 应用大爆发提供坚实的平台支撑。

2631 4 5

小林学AI

1天前

人工智能运维安全

博文

Hermes Agent 核心必学：SubAgent 子代理的 5 个实战技巧，多任务处理效率翻倍

Hermes Agent SubAgent子代理完整教程：掌握delegate_task并行委派、上下文隔离与多任务处理核心能力，提升开发效率。

101 0 0

网络新的开始-49026

机器学习/深度学习人工智能自然语言处理

博文

人工智能（AI）技术的发展史

人工智能 (AI) 的发展历程从20世纪50年代起步，历经初始探索、早期发展、专家系统兴起、机器学习崛起直至深度学习革命。1950年图灵测试提出，1956年达特茅斯会议标志着AI研究开端。60-70年代AI虽取得初步成果但仍遭遇困境。80年代专家系统如MYCIN展现AI应用潜力。90年代机器学习突飞猛进，1997年深蓝战胜国际象棋冠军。21世纪以来，深度学习技术革新了AI，在图像、语音识别等领域取得重大成就。尽管AI已广泛应用，但仍面临数据隐私、伦理等挑战。未来AI将加强人机协作、增强学习与情感智能，并在医疗、教育等领域发挥更大作用。

5976 0 0

容智信息

1天前

SQL 人工智能安全

博文

别再让 AI 温柔地夸你的烂代码了：Code Review 提示词该这样写

AI代码审查不能只求“温柔”，而要像资深工程师一样犀利。本文揭示：模糊提示=无效审查，必须用高精度角色锚点（如Google Staff Engineer）、硬性约束（P0-P3风险分级、可运行重构代码）和结构化输出，让AI真正成为生产级审查助手。提示词，已是工程规范新一环。

75 0 0

浪荡文化

3月前

人工智能安全

博文

从悟空发布看企业级 Agent 平台的下一步：可独立验证的执行证据层

3月17日阿里发布企业级AI原生平台“悟空”，整合账号权限、安全沙箱、Skill生态与钉钉入口，标志Agent从“能对话”迈向“能干活”。本文探讨其关键缺口：平台可控≠结果可验证，呼吁构建可导出、可验证、可第三方复核的“执行证据层”，夯实企业规模化落地的信任基石。（239字）

1885 5 6

阿里云大数据Al技术

人工智能边缘计算自然语言处理

博文

DistilQwen2：通义千问大模型的知识蒸馏实践

DistilQwen2 是基于 Qwen2大模型，通过知识蒸馏进行指令遵循效果增强的、参数较小的语言模型。本文将介绍DistilQwen2 的技术原理、效果评测，以及DistilQwen2 在阿里云人工智能平台 PAI 上的使用方法，和在各开源社区的下载使用教程。

5866 6 8

极客小俊

IDE 测试技术项目管理

博文

【新手必看】PyCharm2025 免费下载安装配置教程+Python环境搭建、图文并茂全副武装学起来才嗖嗖的快,绝对最详细!

PyCharm是由JetBrains开发的Python集成开发环境（IDE），专为Python开发者设计，支持Web开发、调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试和版本控制等功能。它有专业版、教育版和社区版三个版本，其中社区版免费且适合个人和小型团队使用，包含基本的Python开发功能。安装PyCharm前需先安装Python解释器，并配置环境变量。通过简单的步骤即可在PyCharm中创建并运行Python项目，如输出“Hello World”。

5278 13 14

aliyun9540770103

1天前

机器学习/深度学习 API

博文

基于深度学习和YOLOv11的错题自动切分系统

56 3 3

阿里云大数据Al技术

机器学习/深度学习存储算法

博文

DistilQwen2.5发布：通义千问蒸馏小模型再升级

为解决大语言模型在资源有限环境下的高计算成本和复杂性问题，阿里云推出了基于 Qwen2.5 的轻量化模型系列 DistilQwen2.5。该模型通过双层蒸馏框架、数据优化策略及参数融合技术，在保留性能的同时显著降低计算资源消耗。本文提供了详细的使用教程和代码示例，方便用户在 PAI 平台上调用。

3013 7 8

null_is_null

10月前

数据处理开发工具开发者

博文

requirement.txt 管理python包依赖

在 Python 项目中，`requirements.txt` 用于记录依赖库及其版本，便于环境复现。本文介绍了多种生成该文件的方法：基础方法使用 `pip freeze`，进阶方法使用 `pipreqs`，专业方法使用 `poetry` 或 `pipenv`，以及手动维护方式。每种方法适用不同场景，涵盖从简单导出到复杂依赖管理，并提供常见问题的解决方案，帮助开发者高效生成精准的依赖列表，确保项目环境一致性。

2994 4 4