在本文中,你将了解如何使用 Azure 机器学习发现、微调和大规模部署 Azure OpenAI 模型。
一、环境准备
- 必须有权访问 Azure OpenAI 服务。
- 必须位于 Azure OpenAI 支持的区域
二、Azure 机器学习中的 OpenAI 模型是什么?
近年来,人工智能的进步导致了大型基础模型(基于大量数据进行训练)的兴起。 这些模型可以轻松适应各行各业的多种应用程序。 这一新兴趋势为企业在深度学习工作负载中构建和使用这些基础模型提供了独特的机会。
机器学习中的 OpenAI 模型提供机器学习原生功能,使客户可以通过以下方式大规模生成和使用 Azure OpenAI 模型:
- 在机器学习中访问机器学习模型目录中提供的 Azure OpenAI。
- 与 Azure OpenAI 建立连接。
- 使用机器学习微调 Azure OpenAI 模型。
- 使用机器学习将 Azure OpenAI 模型部署到 Azure OpenAI。
三、在机器学习中访问 Azure OpenAI 模型
Azure 机器学习工作室中的模型目录(预览)是浏览各种基础模型集合的起点。 Azure OpenAI 模型集合包含仅在 Azure 上提供的模型。 使用这些模型,客户将能够访问适用于 Azure OpenAI 中提供的大型语言模型的即时工程、微调、评估和部署功能。 可以在 Azure OpenAI 服务集合下的模型目录中查看受支持的 Azure OpenAI 模型的完整列表。
可以按推理任务或微调任务筛选模型目录中的模型列表。 选择特定的模型名称后,将会显示所选模型的模型卡,其中列出了有关该模型的详细信息。
连接到 Azure OpenAI
若要部署 Azure OpenAI 模型,需要具有 Azure OpenAI 资源。 若要创建 Azure OpenAI 资源,请按照创建和部署 Azure OpenAI 服务资源中的说明进行操作。
部署 Azure OpenAI 模型
若要从机器学习部署 Azure OpenAI 模型,请执行以下操作:
- 在左窗格中选择“模型目录”。
- 在 Azure OpenAI 语言模型下选择“查看模型”。 然后选择要部署的模型。
- 选择“部署”,将模型部署到 Azure OpenAI。
- 从选项中选择“Azure OpenAI 资源”。
- 在“部署名称”中输入部署名称,然后选择“部署”。
- 若要查找部署到 Azure OpenAI 的模型,请转到工作区中的“终结点”部分。
- 选择“Azure OpenAI”选项卡,并查找创建的部署。 在选择部署时,系统会将你重定向到已链接到部署的 OpenAI 资源。
四、使用自己的训练数据微调 Azure OpenAI 模型
若要提高工作负载中的模型性能,可能需要使用自己的训练数据微调模型。 通过使用工作室中的微调设置或使用本教程中基于代码的示例,可以轻松微调这些模型。
使用工作室微调
若要调用微调设置窗体,请在任何基础模型的模型卡上选择微调。
微调设置
训练数据
- 传入要用于微调模型的训练数据。 可以选择上传 JSON 行 (JSONL) 格式的本地文件。 也可以从工作区中选择现有的已注册数据集。
- 具有完成任务类型的模型:使用的训练和验证数据必须采用 JSON 文档格式,其中每一行代表一个提示-完成对。
- 具有聊天任务类型的模型:数据集中的每一行都应是 JSON 对象列表。 每一行对应于一个对话。 行中的每个对象都是对话中的一个轮次或语句。
- 验证数据:传入要用于验证模型的数据。
- 在微调窗体中选择“完成”以提交微调作业。 作业完成后,可以查看已微调模型的评估指标。 然后,可以将此经过微调的模型部署到终结点以进行推理。
自定义微调参数
如果要自定义微调参数,可以在微调向导中选择“自定义”,以配置批大小、纪元数和学习速率乘数。 其中每个设置都具有默认值,但如果需要,可以通过基于代码的示例进行自定义。
部署微调的模型
若要从机器学习运行经过微调的模型作业以部署 Azure OpenAI 模型,请执行以下操作:
- 完成 Azure OpenAI 模型的微调后,在“模型”列表中找到微调期间提供的名称的已注册模型,然后选择要部署的模型。
- 选择“部署”并为部署命名。 模型将会部署到链接到工作区的默认 Azure OpenAI 资源。
使用基于代码的示例微调
为了支持用户快速开始使用基于代码的微调,我们已面向 azureml-examples GitHub 存储库发布示例(包括 Python 笔记本和 Azure CLI 示例):
- SDK 示例
- CLI 示例
疑难解答
下面是一些步骤,可帮助你解决机器学习中 Azure OpenAI 的以下任何问题。
在尝试部署 Azure OpenAI 模型时,可能会遇到以下任何错误。
- 每个模型名称和版本只能进行一个部署
- 修复:转到 Azure OpenAI Studio 并删除尝试部署的模型的部署。
- 未能创建部署
- 修复:无法创建 Azure OpenAI。 此错误这是由于配额问题造成的。 请确保具有足够的配额可用于部署。 微调模型的默认配额是每个客户 2 个部署。
- 未能获取 Azure OpenAI 资源
- 修复:无法创建资源。 你不在正确的区域中,或者已超出三个 Azure OpenAI 资源的最大限制。 需要删除现有的 Azure OpenAI 资源,或者需要确保在受支持区域之一中创建了工作区。
- 模型不可部署
- 修复:此错误通常发生在尝试部署 GPT-4 模型时。 由于需求较高,需要[申请访问权限才能使用 GPT-4 模型]。
- 微调作业失败
- 修复:目前,对于新的微调模型,只能为特定订阅指定最多 10 个工作区。 如果用户创建更多工作区,尽管可以获得模型访问权限,但他们的作业将失败。 尝试将每个订阅的工作区数限制为 10。