【DSW Gallery】PAI-DSW快速入门

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: PAI-DSW是一款为AI开发者量身定制的云端机器学习交互式开发IDE,随时随地开启Notebook快速读取数据、开发算法、训练及部署模型。本文介绍如何快速上手PAI-DSW。

直接使用

请打开 PAI-DSW快速入门,并点击右上角 “ 在DSW中打开” 。


PAI-DSW 快速入门

阿里云机器学习PAI(Platform of Artificial Intelligence) 是集数据管理,模型管理,开发,训练,部署为一体的机器学习平台,并为企业级算法团队和数据科学团队提供了一站式开箱即用的机器学习平台解决方案。主要包括:

其中,PAI-DSW是一款在阿里巴巴集团内上百个团队的打磨之下,为数据科学团队和算法团队们量身定制的云端机器学习交互式开发IDE,使读取数据、开发、训练及部署模型更简单高效且安全。

PAI-DSW集成了JupyterlabCode-Server等多种开源项目,并从网络与数据上打通了ODPS多种数据源,方便用户在构建模型的时候免去重新构建数据管道的工作。同时支持将开发环境直接保存为容器镜像并发起离线训练任务,为人工智能数字化转型添砖加瓦。

使用准备

为方便企业级客户和团队使用,PAI设计了AI工作空间 的概念,为团队提供统一的计算资源管理及人员权限管理能力,为AI开发者提供支持团队协作的全流程开发工具及AI资产管理能力。因此在使用上述PAI的功能之前,您需要

使用DSW训练第一个线性回归模型

以下,我们将使用PAI-DSW训练一个简单的线性回归模型,帮助您对产品的基础使用有所了解。

步骤一:安装依赖

如下示范了如何利用Jupyter的快速安装此案例中需要的依赖。

!pip install pandas
Requirement already satisfied: pandas in /Users/yuze/anaconda3/lib/python3.7/site-packages (1.0.1)
Requirement already satisfied: numpy>=1.13.3 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from pandas) (1.18.1)
Requirement already satisfied: python-dateutil>=2.6.1 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from pandas) (2.8.2)
Requirement already satisfied: pytz>=2017.2 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from pandas) (2022.1)
Requirement already satisfied: six>=1.5 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from python-dateutil>=2.6.1->pandas) (1.16.0)
!pip install scikit-learn
Requirement already satisfied: scikit-learn in /Users/yuze/anaconda3/lib/python3.7/site-packages (0.23.2)
Requirement already satisfied: joblib>=0.11 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from scikit-learn) (0.14.1)
Requirement already satisfied: scipy>=0.19.1 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from scikit-learn) (1.4.1)
Requirement already satisfied: threadpoolctl>=2.0.0 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from scikit-learn) (2.1.0)
Requirement already satisfied: numpy>=1.13.3 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from scikit-learn) (1.18.1)
!pip install matplotlib
Requirement already satisfied: matplotlib in /Users/yuze/anaconda3/lib/python3.7/site-packages (3.1.3)
Requirement already satisfied: kiwisolver>=1.0.1 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from matplotlib) (1.1.0)
Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from matplotlib) (2.4.6)
Requirement already satisfied: cycler>=0.10 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from matplotlib) (0.10.0)
Requirement already satisfied: python-dateutil>=2.1 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from matplotlib) (2.8.2)
Requirement already satisfied: numpy>=1.11 in /Users/yuze/anaconda3/lib/python3.7/site-packages (from matplotlib) (1.18.1)
Requirement already satisfied: setuptools in /Users/yuze/anaconda3/lib/python3.7/site-packages (from kiwisolver>=1.0.1->matplotlib) (45.2.0.post20200210)
Requirement already satisfied: six in /Users/yuze/anaconda3/lib/python3.7/site-packages (from cycler>=0.10->matplotlib) (1.16.0)

步骤二:引入依赖

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score
# 使展示的图可以直接在Notebook内显示
%matplotlib inline

步骤三:加载数据,构建模型和训练

from sklearn.datasets import load_diabetes
data = load_diabetes(as_frame=True)
df = pd.concat([pd.DataFrame(data['data']), pd.DataFrame(data['target'])],axis=1) 
# 观察数据格式
df.head()
age sex bmi bp s1 s2 s3 s4 s5 s6 target
0 0.038076 0.050680 0.061696 0.021872 -0.044223 -0.034821 -0.043401 -0.002592 0.019908 -0.017646 151.0
1 -0.001882 -0.044642 -0.051474 -0.026328 -0.008449 -0.019163 0.074412 -0.039493 -0.068330 -0.092204 75.0
2 0.085299 0.050680 0.044451 -0.005671 -0.045599 -0.034194 -0.032356 -0.002592 0.002864 -0.025930 141.0
3 -0.089063 -0.044642 -0.011595 -0.036656 0.012191 0.024991 -0.036038 0.034309 0.022692 -0.009362 206.0
4 0.005383 -0.044642 -0.036385 0.021872 0.003935 0.015596 0.008142 -0.002592 -0.031991 -0.046641 135.0
# 构造训练与测试集,如我们假设BMI指数和糖尿病指数相关,并通过线性回归模型来找出关系
diabetes_X = np.array([df['bmi']]).transpose()
diabetes_y = np.array([df['target']]).transpose()
# 构造训练与测试数据
diabetes_X_train = diabetes_X[:-20]
diabetes_X_test = diabetes_X[-20:]
diabetes_y_train = diabetes_y[:-20]
diabetes_y_test = diabetes_y[-20:]
# 构造模型并训练
regr = linear_model.LinearRegression()
regr.fit(diabetes_X_train, diabetes_y_train)
# 预测
diabetes_y_pred = regr.predict(diabetes_X_test)
# 输出对应指标
print("相关度: ", regr.coef_)
print("Mean squared error: %.2f" % mean_squared_error(diabetes_y_test, diabetes_y_pred))
print("Coefficient of determination: %.2f" % r2_score(diabetes_y_test, diabetes_y_pred))
# 可视化训练结果
plt.scatter(diabetes_X_test, diabetes_y_test, color="black")
plt.plot(diabetes_X_test, diabetes_y_pred, color="blue", linewidth=3)
plt.xticks(())
plt.yticks(())
plt.show()
相关度:  [[938.23786125]]
Mean squared error: 2548.07
Coefficient of determination: 0.47

1.png

这样就完成了一个简单的机器学习模型的训练。关于更多示例内容您可以前往 DSW Gallery 或者直接参考以下章节的内容

数据集管理与使用

云原生AI基础平台DLC使用相关

  • DLC任务提交 本文简述如何通过DSW进行DLC任务的提交与生命周期管理。

在线推理服务EAS使用相关

  • EAS模型部署与调用 本文简述如何通过DSW进行EAS模型推理服务的创建,生命周期管理和调用。

企业和团队使用

数据科学场景开发案例

深度学习场景开发案例

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
机器学习/深度学习 人工智能 编解码
阿里 DSW 试用心得——用 PAI-DSW 修复老照片
通过试用阿里 DSW 了解了命令行和 SD WebUI 两种方式进行老照片修复的相关知识
910 1
阿里 DSW 试用心得——用 PAI-DSW 修复老照片
|
机器学习/深度学习 人工智能 算法
《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)
《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)
1086 0
|
机器学习/深度学习 Cloud Native 算法
【DSW Gallery】一文览尽:机器学习平台PAI模型构建和训练案例全集
本文为您展示DSW Gallery的全部文章,欢迎您浏览。同时文末有动手实验有奖活动,期待您的参与!
【DSW Gallery】一文览尽:机器学习平台PAI模型构建和训练案例全集
|
机器学习/深度学习 人工智能 分布式计算
【DSW Gallery】PAI-DSW开通及授权
本文介绍如何结合AI工作空间开通PAI-DSW并为阿里云子账号授权进行使用。
【DSW Gallery】PAI-DSW开通及授权
|
机器学习/深度学习 运维 IDE
阿里云PAI DSW实例安装R Kernel
PAI-DSW是一款云端机器学习开发IDE,为您提供交互式编程环境,适用于不同水平的开发者。PAI-DSW集成了开源JupyterLab,并以插件化的形式进行深度定制化开发。您无需任何运维配置,即可进行Notebook编写、调试及运行Python代码。当然也可以通过Conda的方式安装R Kernel,使用jupyter运行R脚本。
12947 2
阿里云PAI DSW实例安装R Kernel
|
机器学习/深度学习 运维 IDE
阿里云PAI DSW实例安装Python37
PAI-DSW是一款云端机器学习开发IDE,为您提供交互式编程环境,适用于不同水平的开发者。PAI-DSW集成了开源JupyterLab,并以插件化的形式进行深度定制化开发。您无需任何运维配置,即可进行Notebook编写、调试及运行Python代码。同时,PAI-DSW提供丰富的计算资源,且对接多种数据源。通过EASCMD的方式,可以将PAI-DSW获得的训练模型部署为RESTful接口,对外提供模型服务,从而实现一站式机器学习。本文主要演示如何在DSW实例中安装Python37并创建JupyterLab。
11097 6
阿里云PAI DSW实例安装Python37
|
存储 机器学习/深度学习 运维
PAI DSW挂载NAS存储 Quick Start
PAI-DSW是一款云端机器学习开发IDE,为您提供交互式编程环境,适用于不同水平的开发者。集成了开源JupyterLab,并以插件化的形式进行深度定制化开发。开发者无需任何运维配置,即可进行Notebook编写、调试及运行Python代码。DSW采用计算和存储分离的架构,提供了适合开发者的数据存储方式。 DSW本身提供算力资源和非持久的本地存储,您可以将您的NAS盘或者OSS Bucket挂载到DSW的指定路径下,从而获得更高的安全性和更高的数据存储容量。使用远程磁盘存储后,如果实例因为某种原因退出,数据不会丢失。启动实例进行计算时,磁盘会自动挂载到您的实例,数据能立即可用。
669 0
PAI DSW挂载NAS存储 Quick Start
|
人工智能 运维 API
【DSW Gallery】企业和团队如何使用PAI-DSW协作开发
DSW提供完善的实例管理、资源管理、权限管理等功能,助力企业或团队,完成多人协作的开发工作。
【DSW Gallery】企业和团队如何使用PAI-DSW协作开发
【DSW Gallery】PAI-DSW计费方式介绍
PAI-DSW产品针对用户的不同场景提供灵活的计费方式,目前支持个人版按量付费和预付费专有资源组包年包月两种计费方式,本文详细介绍这两种计费方式,用户可以根据业务的特点进行选择。
【DSW Gallery】PAI-DSW计费方式介绍
|
机器学习/深度学习
阿里云机器学习DSW实例如何升级配置
在使用阿里云机器学习DSW时,实例的规格是在一开始就创建好了,那么如何给已经创建好的实例修改规格呢?实例是无法直接修改规格的,本篇内容简单介绍下通过保存镜像的方式升级DSW实例规格
328 0
阿里云机器学习DSW实例如何升级配置

相关产品

  • 人工智能平台 PAI