机器学习 PAI-DSW 基础

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 机器学习 PAI-DSW 基础

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):机器学习 PAI-DSW 基础】

课程地址https://edu.aliyun.com/course/3112108/lesson/19257


机器学习 PAI-DSW 基础

 

内容介绍:

一、机器学习 PAI-DSW 概述

二、功能特性与应用场景

 

一、机器学习 PAI-DSW 概述

1.PAI-DSW 的定义

PAI-DSW(Data Science Workshop)

一套环境:PAI 平台为算法开发者打造的云端深度学习开发环境,

交互建模:提供 Notebook 交互建模方法

性能优化: 提供阿里巴巴深度优化的TensorFlow 框架,并通过编译优化提升训练性能

图片414.png

DSW 是 data science workshop 的缩写数据科学,workshop 可以理解为工作坊。首先 PAI-DSW 是一套环境,PAI 平台为算法开发者打造的云端深度学习开发环境,登录上去然后远程环境就在里面,这套环境是一个交互建模的环境,提供 notebook 的交互建模方法,PAI-DSW 打开如上图,能看到 Notebook,可以用 Python 语言进行开发、性能优化,在 PAI-DSW 提供TensorFlow 框架,是阿里巴巴经过深度优化的TensorFlow 框架,并且通过边优化来提升训练性能,打开 PAI-DSW 的界面如图所示。

 

2.PAI-DSW 组件

云端交互式开发平台

直接选择镜像获得开发环境;

支持交互式建模,支持 CPU 和 GPU 资源

图片415.png

DSW 是一个云端的交互式开发平台,用起来非常方便,找远程用随便一台电脑登录上之后就可以打开环境,环境集成是集成的 jupyter,打开之后用 python 开发的用户可能都会很熟悉这个环境,可以在这个环境里面直接用 python 写代码,非常友好的界面。另外还有terminal 是常规的操作,打开终端控制台面对的就是 linux 的服务器,用命令行去交互,tax file 文本文件还有 markdown file 有标记的文本都是很方便的去新建,因为内置了阿里云优化 TensorFlow 所以也集成了一个 Tensorboard,TensorFlow 的可视化工具。

建环境可以直接选择镜像获得开发环境,官方是已经预置了一些镜像,打开下拉框的时候可以看到官方镜像下面有一些已经预制好的,从里面选择一个就可以,一般都是 TensorFlow 相关的镜像还有 pytorch 等等,镜像是在不断更新的过程中,里面有一些稍微版本比较低的也会保留,因为有一些实验需要不同版本的并行环境,除了乌班图之外也有别的系统可以选,官方镜像已经能满足大部分的需求,用起来非常方便,搭一个 UDPU、Coda 然后再搭一个 Python、pytorch 或者 TensorFlow 的环境要很长的时间,同时很多环境要去测试很麻烦,有镜像之后可以快速的进到需要的环境,节约了大量的时间,如果里面预知的镜像不满足还可以用自己定义的镜像,使用自己镜像的时候在选项里面选镜像 URL,放自己建好的镜像地址,在平台里面打开自己的镜像,环境里面还可以支持 CPU 跟 GPU 的资源,可以去选比如当前的环境是用 CPU 还是用 DPU,如果用 GPU 是什么样的显卡,英伟达、特斯拉、geforce 等等有很多选项,CPU 还可以去选是几何,用云端的交互式开发平台,平台的硬件有CPU、GPU 资源和平台的软件,装到操作系统已经预安装的一些人工智能框架,环境都可以选,选择之后动态的去生成,非常的方便。

 

3.PAI-DSW 的前置知识

01.对深度学习神经网络、卷积神经网络、循环神经网络等知识有一定了解。
图片416.png02.对 Python 开发有一定了解。

首先要对深度学习的神经网络,卷积神经网络,循环神经网络有一定的了解,因为做开发要自己去做网络的模型,DSW 里面已经预置覆盖了很多版本的主流计算框架,像 TensorFlow、pytorch,但是这里面的神经网络要自己会去搭,因为是代码交互,所以要会写代码才可以,要对 Python 开发有一定的了解,要知道 Python 的语法,notebook 环境的使用方法,Python 的包管理的方法和 Python 的程序、执行的方法等等,对 Python 的开发有一定的了解,因为环境主要是 linux 有很多都是乌版图的环境,所以对操作系统 linux 最好也有一定的了解。

 

4.PAI-DSW 的优势

01支持的神经网络

DNN,CNN,RNN 等常见网络

02网络模型开发

交互式代码开发

03调参

平台支持自动调参

04运行环境

云端实例,可配置 CPU 和 GPU

05支持多种开发模式

支持 Jupyter、VS Code、Terminal 等多种开发模式
图片417.png


首先支持的神经网络比较多,支持 DNN,CNN,RNN 等常见网络,另外 PAI-DSW 还预装了常用的大数据开发算法包,而且很好的一点是开放的管理员权限 Sudo 权限,所以用 DSW 的时候可以自己去安装第三方的库,可以理解成为只要有神经网络都可以支持。

第二个是网络模型开发用的是交互式的代码开发,如果用过 notebook 会发现开发的方式非常的方便,因为是交互的方式,所以可以实时的去看结果,执行起来也非常的方便。

开发完网络模型之后经常做的事情是调参,DSW 是支持自动调参的,DSW 已经内置了调参的工具 OTOML 是 auto machine learning,在很多的情况下自动的调餐比人工的调参可能效果要好。

第四个方面是运行环境,DSW 使用的是云端实例背靠着阿里云的平台,可以去配置 CPU 和 GPU,运行环境的资源是可以用 PAI-DLC 的公共资源组来创建实例,在这种环境下 CPU 的数量可以到32个,内存最大可以到 128G,带宽可以到时区的带宽,GPU 主要是用的英伟达100,最多的时候可以扩展到八块,这种算力对大部分的应用场景已经足够。

第五个优势是 PAI-DSW 支持多种开发模式,能够支持 Jupyter、VS Code、Terminal 等等,可以满足不同开发软件的需求。

 

二、功能特性与应用场景


1.PAI-DSW 的功能特性

图片418.png


01支持资源实时监控,算法开发时,可以显示 CPU 或 GPU 的使用情况。

02支持多源数据接入,包括 MaxCompute、OSS 及 NAS。

MaxCompute 是阿里企业级的大数据计算服务,能够提供 PV 级的数据仓库解决方案,oss 是阿里云的对象存储 object storage service,NAS 是网络存储的数据源。

03支持编写和运行 SQL 语句。

对于关系数据库的数据获取非常方便。

04支持多种资源类型,公共资源组及 DLC 专有资源组。

05支持灵活切换各类资源,有效降低使用成本。

云端弹性带来的优势。

06预置常用大数据开发包和算法库,且支持自定义安装第三方库。

 

2.PAI-DSW 的应用场景
图片419.png


做深度学习算法开发的时候,繁琐的环境配置很麻烦,要考虑硬件的环境用什么样的算力、CPU、GPU,多大的现存够支撑开发,然后数据需要多少存储都很麻烦,用什么样的操作系统、GPU,用 GPU 的要去装很多东西,像 CODE,不同的版本对应的框架不一样,对应的 CODE 的版本又要去装相应的框架版本,在开发的过程中还不止用到一个框架,在用一些框架的时候可能用到很多其他的包,就会导致要花大量的时间在环境配置上面,环境的一些变动也会带来很多的问题,使用的 PAI-DSW 不再需要繁琐的环境配置,用容器的技术打开现成的环境马上就可以用,只要几秒钟启动一下环境就可以。

第二个是随时随地的编写算法代码,使用 PAI-DSW 对终端的设备要求非常低,只要有一个浏览器就可以打开甚至不用浏览器,远程上来就可以,不用自己随身去带着 GPU 很好的一个本子去做算力,然后耗度高,这样方便随时随地的打开,可以写算法的代码,使用 PAI-DSW 工作的方式应该是未来的趋势, PAI-DSW 还可以辅助教育从业者来实现在线的教学演示和科研项目的开放,教育从业者常会遇到需要在不同的环境之间切换的情况,不同的案例用到不同的环境,PAI-DSW 非常容易的解决了这个问题,在教学演示的过程中使用它非常方便,很多学习、学生或者是进行 AI 学习的人在进行练习的时候也是这样的,也可以使用PAI-DSW 很方便的去完成一些项目的实践,科研项目的开发也是类似的。

 

3.本节回顾

通过本节的学习,我们学到了:

机器学习 PAI-DSW 概述

机器学习 PAI-DSW 是 PAI 平台为算法开发者打造的云端深度学习开发环境,提供 Notebook 交互建模方法,提供阿里巴巴深度优化的 TensorFlow 框架,并通过编译优化提升训练性能

功能特性与应用场景

机器学习 PAI-DSW 的功能特性主要包括支持资源实时监控、多源数据接入、编写运行 SQL 语句、多种资源类型、灵活切换各类资源、预置常用大数据开发包和算法库

机器学习 PAI-DSW 的应用场景涵盖深度学习算法开发

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
2月前
|
机器学习/深度学习 算法 数据挖掘
Python数据分析革命:Scikit-learn库,让机器学习模型训练与评估变得简单高效!
在数据驱动时代,Python 以强大的生态系统成为数据科学的首选语言,而 Scikit-learn 则因简洁的 API 和广泛的支持脱颖而出。本文将指导你使用 Scikit-learn 进行机器学习模型的训练与评估。首先通过 `pip install scikit-learn` 安装库,然后利用内置数据集进行数据准备,选择合适的模型(如逻辑回归),并通过交叉验证评估其性能。最终,使用模型对新数据进行预测,简化整个流程。无论你是新手还是专家,Scikit-learn 都能助你一臂之力。
132 8
|
3月前
|
机器学习/深度学习 API 网络架构
"解锁机器学习超级能力!Databricks携手Mlflow,让模型训练与部署上演智能风暴,一触即发,点燃你的数据科学梦想!"
【8月更文挑战第9天】机器学习模型的训练与部署流程复杂,涵盖数据准备、模型训练、性能评估及部署等步骤。本文详述如何借助Databricks与Mlflow的强大组合来管理这一流程。首先需在Databricks环境内安装Mlflow库。接着,利用Mlflow跟踪功能记录训练过程中的参数与性能指标。最后,通过Mlflow提供的模型服务功能,采用REST API或Docker容器等方式部署模型。这一流程充分利用了Databricks的数据处理能力和Mlflow的生命周期管理优势。
142 7
|
3月前
|
机器学习/深度学习 运维 算法
【阿里天池-医学影像报告异常检测】3 机器学习模型训练及集成学习Baseline开源
本文介绍了一个基于XGBoost、LightGBM和逻辑回归的集成学习模型,用于医学影像报告异常检测任务,并公开了达到0.83+准确率的基线代码。
65 9
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
基于PAI-QuickStart搭建一站式模型训练服务体验
【8月更文挑战第5天】基于PAI-QuickStart搭建一站式模型训练服务体验
124 0
|
3月前
|
机器学习/深度学习 存储 人工智能
【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战
【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战
371 0
|
5月前
|
机器学习/深度学习 人工智能 数据处理
人工智能平台PAI产品使用合集之PAI-DSW实例服务器ping不通google.com,该如何排查
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
机器学习/深度学习 存储 分布式计算
PAI机器学习平台如何进行分布式训练?
【7月更文挑战第1天】PAI机器学习平台如何进行分布式训练?
130 1
|
4月前
|
机器学习/深度学习 算法 数据挖掘
Python数据分析革命:Scikit-learn库,让机器学习模型训练与评估变得简单高效!
【7月更文挑战第27天】在数据驱动时代,Python以丰富的库成为数据科学首选。Scikit-learn因简洁高效而备受青睐,引领数据分析革命。本文引导您使用Scikit-learn简化机器学习流程。首先通过`pip install scikit-learn`安装库。接着使用内置数据集简化数据准备步骤,例如加载Iris数据集。选择合适的模型,如逻辑回归,并初始化与训练模型。利用交叉验证评估模型性能,获取准确率等指标。最后,应用训练好的模型进行新数据预测。Scikit-learn为各阶段提供一站式支持,助力数据分析项目成功。
72 0
|
4月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之如何实现嵌入式设备到物联网平台再到PAI DSW的云边结合
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能平台PAI产品使用合集之进入DSW后,如何把工作环境切换为GPU状态
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。