Azure 机器学习 - 为端到端机器学习生命周期使用企业级 AI 服务。
一、什么是 Azure 机器学习?
Azure 机器学习是一种用于加速和管理机器学习项目生命周期的云服务。机器学习专业人员、数据科学家和工程师可以在日常工作流中使用它:训练和部署模型,以及管理 MLOps。可以在 Azure 机器学习中创建模型,也可以使用从开源平台构建的模型,例如 Pytorch、TensorFlow 或 scikit-learn。MLOps 工具有助于监视、重新训练和重新部署模型。
大规模生成业务关键型机器学习模型
Azure 机器学习使数据科学家和开发人员能够更快、更自信地构建、部署和管理高质量模型。它通过行业领先的机器学习操作 (MLOps)、开源互操作性和集成工具加速价值。此受信任的平台专为机器学习中的负责任 AI 应用程序而设计。
二、Azure 机器学习适合哪些人群?
Azure 机器学习适用于要在其组织内实现 MLOps(以便在安全且可审核的生产环境中将机器学习模型投入生产)的个人和团队。
数据科学家和 ML 工程师将找到用于加快和自动执行其日常工作流的工具。应用程序开发人员会找到用于将模型集成到应用程序或服务的工具。平台开发人员将找到由持久 Azure 资源管理器 API 提供支持的一组可靠工具,用于构建高级 ML 工具。
使用 Microsoft Azure 云中的企业将在基础结构方面发现熟悉的安全性和基于角色的访问控制 (RBAC)。可以设置项目以拒绝对受保护数据的访问并选择操作。
三、Azure 机器学习的价值点
加快价值实现速度
使用灵活、强大的 AI 基础结构支持的熟悉框架进行快速、自定义的模型开发 。
协作并简化 MLOps
用于跨工作区协作和 MLOps 的快速 ML 模型部署、管理和共享。
信心十足地开发
用于在任何位置运行机器学习工作负载的内置治理、安全性和符合性。
负责任地设计
负责任 AI 使用数据驱动的决策来构建可解释的模型,以实现透明度和责任。
四、端到端机器学习生命周期的支持
准备数据
生成和训练模型
验证和部署
管理和监视
机器学习深度学习
托管端到端的平台
使用本机MLOps功能简化整个深度学习生命周期和模型管理。借助企业级安全性,安全地在任意位置运行机器学习。使用负责任的 AI 仪表板缓解模型偏差并评估模型。
任何开发工具和框架
在所选的框架中使用PyTorch 和 TensorFlow,通过首选的集成开发环境 (IDE),从 Visual Studio Code 到 Jupyter Notebook 构建深度学习模型。Azure 机器学习与 ONNX Runtime和 DeepSpeed 进行互操作,以优化训练和推理。
世界一流性能
使用专门构建的 AI 基础结构 将最新的 NVIDIA GPU 和最高可达 400 Gbps 的 InfiniBand 网络解决方案组合在一起。在具有前所未有的规模的单个群集中纵向扩展到数千个 GPU。
五、实战场景
通过快速模型开发加快价值实现
使用支持机器学习任务的统一工作室体验提高工作效率。使用对常用开源框架和库的内置支持,使用 Jupyter Notebook 生成、训练和部署模型。通过自动化机器学习快速为表格、文本和图像模型创建准确的模型。使用 Visual Studio Code 无缝地从本地到云训练,并通过 NVIDIA Quantum-2 InfiniBand 平台提供支持的Azure AI 基础结构进行自动缩放。
使用 MLOps 协作并简化模型管理
在混合平台上构建企业级解决方案
使用 Microsoft Purview 中的内置数据治理,在机器学习生命周期中将安全性放在第一位。利用涵盖标识、数据、网络、监视和合规性的全面安全功能,这些功能均由 Microsoft 测试和验证。使用自定义基于角色的访问控制、虚拟网络、数据加密、专用终结点和专用 IP 地址保护解决方案。在任何位置(从本地到多云)训练和部署模型,以满足数据主权要求。使用内置策略和 60 项认证(包括 FedRAMP High 和 HIPAA)合规性自信地进行治理。
在整个生命周期中使用负责任 AI 做法
使用可重现和自动化的工作流评估机器学习模型,以评估模型公平性、可解释性、错误分析、因果分析、模型性能和探索性数据分析。在负责任 AI 仪表板中使用因果分析进行实时干预,并在部署时生成记分卡。将技术和非技术受众的负责任的 AI 指标上下文化为涉及利益干系人并简化合规性评审。
整个机器学习生命周期的关键服务功能