Azure 机器学习 - 使用 Jupyter Notebook 探索 Azure 机器学习

简介: Azure 机器学习 - 使用 Jupyter Notebook 探索 Azure 机器学习

本文介绍如何创建并连接到安全的 Azure 机器学习工作区。 本文中的步骤使用 Azure 机器学习托管虚拟网络围绕 Azure 机器学习使用的资源创建安全边界。


一、前言

在本教程中,你将完成以下任务:

  • 创建配置为使用托管虚拟网络的 Azure 机器学习工作区。
  • 创建 Azure 机器学习计算群集。 在云中训练机器学习模型时会用到计算群集。

完成本教程后,你将拥有以下体系结构:

  • 使用专用终结点的 Azure 机器学习工作区,用于使用托管网络进行通信。
  • 借助使用专用终结点的 Azure 存储帐户,可以让存储服务(如 Blob 和文件)使用托管网络进行通信。
  • 使用专用终结点的 Azure 容器注册表通过托管网络进行通信。
  • 使用专用终结点的 Azure Key Vault 通过托管网络进行通信。
  • 受托管网络保护的 Azure 机器学习计算实例和计算群集。
  • Azure 订阅。 如果没有 Azure 订阅,请在开始操作前先创建一个免费帐户。 试用免费版或付费版 Azure 机器学习。

二、创建跳转盒 (VM)

可以通过多种方式连接到安全的工作区。 本教程中将会用到跳转盒。 跳转盒是 Azure 虚拟网络中的虚拟机。 可以使用 Web 浏览器和 Azure Bastion 连接到它。

下表列出了可以连接到安全工作区的其他几种方法:

方法 说明
Azure VPN 网关 通过专用连接将本地网络连接到 Azure 虚拟网络。 工作区的专用终结点将在该虚拟网络中创建。 通过公共 Internet 建立连接。
ExpressRoute 通过专用连接将本地网络连接到云。 使用连接提供程序建立连接。

重要

使用“VPN 网关”或“ExpressRoute”时,需要规划名称解析在本地资源与云端资源之间的工作方式。 有关详细信息,请参阅使用自定义 DNS 服务器。

使用以下步骤创建 Azure 虚拟机以用作跳转盒。 然后,可以从 VM 桌面使用 VM 上的浏览器连接到托管虚拟网络内的资源,例如 Azure 机器学习工作室。 或者,可以在 VM 上安装开发工具。

提示

以下步骤将创建 Windows 11 企业版 VM。 根据要求,可能需要选择不同的 VM 映像。 如果需要将 VM 加入组织的域,Windows 11(或 10)企业版映像非常有用。

  1. 在 Azure 门户中,选择左上角的门户菜单。 从菜单中选择“+ 创建资源”,然后输入“虚拟机”。 选择“虚拟机”条目,然后选择“创建”。
  2. 从“基本信息”选项卡中,选择要在其中创建服务的订阅资源组区域。 提供以下字段的值:
  • 虚拟机名称:VM 的唯一名称。
  • 用户名:将用于登录 VM 的用户名。
  • 密码:用户名的密码。
  • 安全类型:标准。
  • 映像:Windows 11 企业版。
    提示
    如果 Windows 11 企业版不在映像选择列表中,请使用“查看所有映像”_。 找到 Microsoft 的“Windows 11”条目,然后使用“选择”下拉菜单选择企业版映像。
可将其他字段保留为默认值。

  1. 选择“网络”。 查看网络信息,确保它未使用 172.17.0.0/16 IP 地址范围。 如果使用了,请选择其他范围,例如 172.16.0.0/16;172.17.0.0/16 范围可能会导致与 Docker 冲突。
    备注
    Azure 虚拟机将创建自己的 Azure 虚拟网络以实现网络隔离。 此网络独立于 Azure 机器学习使用的托管虚拟网络。

  1. 选择“查看 + 创建”。 确认信息无误,然后选择“创建”。

为 VM 启用 Azure Bastion

使用 Azure Bastion,可通过浏览器连接到 VM 桌面。

  1. 在 Azure 门户中,选择之前创建的 VM。 在页面的“操作”部分中,选择“Bastion”,然后选择“部署 Bastion”。

  1. 部署 Bastion 服务后,会看到一个连接页面。 暂时保留此对话框中的内容。

三、创建工作区

  1. 在 Azure 门户中,选择左上角的门户菜单。 从菜单中,选择“+ 创建资源”,然后输入“Azure 机器学习”。 选择“Azure 机器学习”条目,然后选择“创建”。
  2. 从“基本信息”选项卡中,选择要在其中创建服务的订阅资源组区域。 对于“工作区名称”,请输入唯一名称。 让其余字段保留默认值;将为工作区创建所需服务的新实例。

  1. 在“网络”选项卡中,选择“Internet 出站专用”。

  1. 在“网络”选项卡的“工作区入站访问”部分中,选择“+ 添加”。

  1. 在“创建专用终结点”窗体的“名称”字段中输入唯一值。 选择之前使用 VM 创建的虚拟网络,并选择默认子网。 将其余字段保留为默认值。 选择“确定”,以保存此终结点。

  1. 选择“查看 + 创建”。 确认信息无误,然后选择“创建”。
  2. 创建工作区后,选择“转到资源”。

四、连接到 VM 桌面

  1. 在 Azure 门户中,选择之前创建的 VM。
  2. 在“连接”部分中,选择“Bastion”。 输入为 VM 配置的用户名和密码,然后选择“连接”。


五、连接到机器学习工作室

此时,已创建工作区,但尚未创建托管虚拟网络。 托管虚拟网络是在创建工作区时配置的,但不会在创建第一个计算资源或手动预配之前完成创建。

请遵循以下步骤来创建计算实例。

  1. 在 VM 桌面上,使用浏览器打开 Azure 机器学习工作室并选择之前创建的工作区。
  2. 在工作室中,依次选择“计算”、“计算实例”和“+ 新建”。

  1. 在“配置所需设置”对话框中,为“计算名称”输入唯一值。 让其余选择保留默认值。
  2. 选择“创建” 。 创建计算实例需要几分钟时间。 计算实例是在托管网络中创建的。
    提示
    创建第一个计算资源可能需要几分钟时间。 导致此延迟的原因是托管虚拟网络也在创建中。 在创建第一个计算资源之前,不会创建托管虚拟网络。 后续托管计算资源的创建速度要快得多。

允许工作室访问存储

由于 Azure 机器学习工作室部分运行在客户端的 Web 浏览器中,因此客户端需要能够直接访问工作区的默认存储帐户来执行数据操作。 若要启用该功能,请使用以下步骤:

  1. 在 Azure 门户中,选择之前创建的跳转盒 VM。 从“概述”部分复制“公共 IP 地址”。
  2. 在 Azure 门户中,选择之前创建的工作区。 从“概述”部分选择“存储”条目的链接。
  3. 从存储帐户中选择“网络”,然后将跳转盒的公共 IP 地址添加到“防火墙”部分。
    提示
    在使用 VPN 网关或 ExpressRoute 而不是跳转盒的情况下,可以将存储帐户的专用终结点或服务终结点添加到 Azure 虚拟网络。 使用专用终结点或服务终结点,通过 Azure 虚拟网络连接的多个客户端就可以通过工作室成功执行存储操作。
    此时,可以使用该工作室以交互方式在计算实例上使用笔记本,并运行训练作业。 如需相关教程,请参阅教程:模型开发。

六、停止计算实例

当它运行(启动)时,计算实例会继续向你的订阅收费。 为了避免额外成本,请在未使用时停止运行。

在工作室中,选择“计算”、“计算实例”,然后选择计算实例。 最后,从页面顶部选择“停止”。


七、清理资源

如果打算继续使用安全的工作区和其他资源,请跳过本部分。

若要删除本教程中创建的所有资源,请执行以下步骤:

  1. 在 Azure 门户中,选择“资源组”。
  2. 从列表中选择你在本教程中创建的资源组。
  3. 选择“删除资源组”。

  1. 输入资源组名称,然后选择“删除”。
目录
相关文章
|
6月前
|
数据采集 机器学习/深度学习 数据可视化
使用Jupyter Notebook进行数据分析:入门与实践
【6月更文挑战第5天】Jupyter Notebook是数据科学家青睐的交互式计算环境,用于创建包含代码、方程、可视化和文本的文档。本文介绍了其基本用法和安装配置,通过一个数据分析案例展示了如何使用Notebook进行数据加载、清洗、预处理、探索、可视化以及建模。Notebook支持多种语言,提供直观的交互体验,便于结果呈现和分享。它是高效数据分析的得力工具,初学者可通过本文案例开始探索。
|
4月前
|
Python
Jupyter Notebook又一利器nbterm,在终端玩notebook!
Jupyter Notebook又一利器nbterm,在终端玩notebook!
|
4月前
|
机器学习/深度学习 存储 Linux
【机器学习 Azure Machine Learning】使用VS Code登录到Linux VM上 (Remote-SSH), 及可直接通过VS Code编辑VM中的文件
【机器学习 Azure Machine Learning】使用VS Code登录到Linux VM上 (Remote-SSH), 及可直接通过VS Code编辑VM中的文件
|
4月前
|
机器学习/深度学习 Ubuntu Linux
【机器学习 Azure Machine Learning】使用Aure虚拟机搭建Jupyter notebook环境,为Machine Learning做准备(Ubuntu 18.04,Linux)
【机器学习 Azure Machine Learning】使用Aure虚拟机搭建Jupyter notebook环境,为Machine Learning做准备(Ubuntu 18.04,Linux)
|
4月前
|
SQL 机器学习/深度学习 开发工具
【机器学习 Azure Machine Learning】Azure Machine Learning 访问SQL Server 无法写入问题 (使用微软Python AML Core SDK)
【机器学习 Azure Machine Learning】Azure Machine Learning 访问SQL Server 无法写入问题 (使用微软Python AML Core SDK)
|
6月前
|
文字识别 异构计算 Python
关于云端Jupyter Notebook的使用过程与感想
在自学Python时,由于家庭电脑使用冲突和设备老旧,转向云端平台。体验了多个服务:1. 魔搭modelscope(最喜欢,赠送资源丰富,社区活跃),2. Colaboratory(免费GPU,但有时重启,建议用阿里云),3. Deepnote(免费环境有限,但GPT-4代码生成功能强大),4. 飞桨aistudio(适合PaddlePaddle用户),5. ModelArts(曾有免费实例,现难找)。综合来看,阿里云的稳定性与服务更优,尤其是魔搭的自动代码修正功能。对于AIGC,推荐魔搭和付费版PAI-DSW。欢迎分享更多云端Jupyter平台体验。
354 1
|
6月前
|
Python 数据挖掘 数据可视化
Python数据分析——Pandas与Jupyter Notebook
【6月更文挑战第1天】 本文探讨了如何使用Python的Pandas库和Jupyter Notebook进行数据分析。首先,介绍了安装和设置步骤,然后展示了如何使用Pandas的DataFrame进行数据加载、清洗和基本分析。接着,通过Jupyter Notebook的交互式环境,演示了数据分析和可视化,包括直方图的创建。文章还涉及数据清洗,如处理缺失值,并展示了如何进行高级数据分析,如数据分组和聚合。此外,还提供了将分析结果导出到文件的方法。通过销售数据的完整案例,详细说明了从加载数据到可视化和结果导出的全过程。最后,讨论了进一步的分析和可视化技巧,如销售额趋势、产品销售排名和区域分布,以及
274 2
|
7月前
|
JSON 数据可视化 数据挖掘
适合数据分析的ide---Jupyter Notebook的安装使用
适合数据分析的ide---Jupyter Notebook的安装使用
127 2
|
7月前
|
Ubuntu 网络安全 数据安全/隐私保护
使用SSH隧道将Ubuntu云服务器Jupyter Notebook端口映射到本地
这样,你就成功地将Ubuntu云服务器上的Jupyter Notebook端口映射到本地,使你能够通过本地浏览器访问并使用Jupyter Notebook。
508 1
|
7月前
|
Linux 数据安全/隐私保护
anaconda运行Notebook和jupyter报错resource.setrlimit(resource.RLIMIT_NOFILE, (soft, hard)) ValueError
anaconda运行Notebook和jupyter报错resource.setrlimit(resource.RLIMIT_NOFILE, (soft, hard)) ValueError
66 0