在学习数据科学的时候,我们往往需要从各个地方下载各种各样的数据集和代码。其中大名鼎鼎的就是我们的Github。这篇文章会简单讲讲我们如何从Github下载想要的学习资源,然后在DSW上进行运行和学习。
Step 0: 购买华东2地区的PAI-DSW
记得要先购买。 购买地址 现在只有华东2地区的资源可以访问github
Step 1: 选择华东2地区的PAI-DSW P100 系列
这边 一定 要选择P100系列的,这个系列最近有很多活动 而且也只有华东2地区的p100系列可以访问github
Step 2: 打开PAI实例
然后我们通过控制台打开我们的PAI-DSW实验室
Step 3: 创建Terminal
滑动DSW Launcher到底部,单击Terminal启动一个命令行的Session
Step 4: 输入想要下载的仓库的命令
这里就和平时我们从github上面clone东西一样,通过输入 git clone https://github.com/jakevdp/PythonDataScienceHandbook.git
并运行就可以下载了。我这边以数据科学方向大牛 Jake Vanderplas 的一本 数据科学基本法 为例,将这本书下载到DSW中去。
Step 5: 打开刚刚下载的文件夹,开始阅读数据科学基本法
文件下载完成之后,在左边就能看到了。要注意下载的路径,不要下载了之后找不到就尴尬了
以上就是一个简单的通过PAI下载Github上代码仓的教程,欢迎大家私聊我更多资源~