开发者社区> 大数据与机器学习> 人工智能平台PAI

人工智能平台PAI

关注

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

0
今日
3385
内容
27
活动
3871
关注
|
机器学习/深度学习 人工智能 物联网
|

玩转AIGC | 5分钟使用PAI一键部署Stable Diffusion AI绘画应用

本文将展示如何通过阿里云机器学习PAI 快速部署SD文生图模型并启动WebUI 进行推理服务。

16972 7
|
2月前
|
人工智能 算法
|

【AI大模型面试宝典十】- 推理部署篇

【AI大模型面试宝典】聚焦模型压缩核心技术:量化解析(INT8/INT4/GPTQ/AWQ)、激活量化、稀疏化与知识蒸馏,配实战代码与面试高频题。助你攻克大模型部署难题,精准提升面试竞争力,offer轻松拿!点赞关注,持续更新中~

208 0
|
算法
|

PAI下面的gbdt、xgboost、ps-smart 算法如何优化?

设置gbdt 、xgboost等算法的样本和特征的采样率

498 2
|
弹性计算 人工智能 运维
|

60分钟深度测评阿里云基于大模型构建的操作系统智能助手

OS Copilot 概要 OS Copilot 是阿里巴巴云针对Linux操作系统开发的智能助手,集成在Alibaba Cloud Linux中,利用大模型技术提供自然语言问答、命令行辅助、阿里云CLI调用和系统运维功能。它尤其适合新手,直观的交互方式提升效率。此外,OS Copilot支持在操作系统内直接管理阿里云资源,简化运维任务。目前,该助手仅在特定版本的Alibaba Cloud Linux上可用。体验者可以通过提供的链接和指南进行实操,体验其功能,如命令行的自然语言交互和环境变量配置。OS Copilot在提高用户体验和工作流集成方面的创新,预示着未来AI在操作系统中的广泛应用。

766 1
|
机器学习/深度学习 数据采集 人工智能
|

【AAAI 2024】解锁深度表格学习(Deep Tabular Learning)的关键:算术特征交互

近日,阿里云人工智能平台PAI与浙江大学吴健、应豪超老师团队合作论文《Arithmetic Feature Interaction is Necessary for Deep Tabular Learning》正式在国际人工智能顶会AAAI-2024上发表。本项工作聚焦于深度表格学习中的一个核心问题:在处理结构化表格数据(tabular data)时,深度模型是否拥有有效的归纳偏差(inductive bias)。

1132 2
|
JSON 自然语言处理 对象存储
|

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务,在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

64427 7
|
机器学习/深度学习 人工智能 缓存
|

EasyCV DataHub 提供多领域视觉数据集下载,助力模型生产

在人工智能广泛应用的今天,深度学习技术已经在各行各业起到了重要的作用。在计算机视觉领域,深度学习技术在大多数场景已经替代了传统视觉方法。如果说深度学习是一项重要的生产工具,那么数据就是不可或缺的生产资料,巧妇难为无米之炊,数据对于视觉模型生产起到了至关重要的作用。

1002 0
|
2月前
|
数据采集 人工智能 算法
|

AI数字人技术厂商市场格局观察

AI数字人技术正从娱乐迈向多元实用场景,2024年市场规模达41.2亿元,增速超85%。世优科技深耕全栈技术,拥60余项专利,服务千余家品牌,助力政企智能化升级,推动行业向标准化、生态化发展。

200 1
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

基于PAI-ChatLearn的GSPO强化学习实践

近期,阿里通义千问团队创新性提出了GSPO算法,GSPO 算法与其他 RL 算法相比,定义了序列级别的重要性比率,并在序列层面执行裁剪、奖励和优化。同时具有强大高效、稳定性出色、基础设施友好的突出优势。

879 3

PAI-Rec推荐平台对于实时特征有三个层次

PAI-Rec推荐平台针对实时特征有三个处理层次:1) 离线模拟反推历史请求时刻的实时特征;2) FeatureStore记录增量更新的实时特征,模型特征导出样本准确性达99%;3) 通过callback回调接口记录请求时刻的特征。各层次确保了实时特征的准确性和时效性。

594 0
|
边缘计算 文字识别 自然语言处理
|

当OCR遇见大语言模型:智能文本处理的进化之路

简介:本文探讨光学字符识别(OCR)技术与大语言模型(LLM)结合带来的革新。传统OCR在处理模糊文本、复杂排版时存在局限,而LLM的语义理解、结构解析和多模态处理能力恰好弥补这些不足。文中通过代码实例展示了两者融合在错误校正、文档解析、多语言处理、语义检索及流程革新上的五大优势,并以财务报表解析为例,说明了该技术组合在实际应用中的高效性。此外,文章也展望了未来的技术发展趋势,包括多模态架构、小样本学习和边缘计算部署等方向,预示着文本处理技术正迈向智能认知的新时代。(240字)

918 1
|
人工智能 自然语言处理 算法
|

AI时代的企业内训全景图:从案例到实战

作为一名扎根在HR培训领域多年的“老兵”,我越来越清晰地感受到,企业内训的本质其实是为企业持续“造血”。无论是基础岗的新人培训、技能岗的操作规范培训,还是面向技术中坚力量的高阶技术研讨,抑或是管理层的战略思维提升课,内训的价值都是在帮助企业内部提升能力水平,进而提高组织生产力,减少对外部资源的依赖。更为重要的是,在当前AI、大模型、Embodied Intelligence等新兴技术快速迭代的背景下,企业必须不断为人才升级赋能,才能在市场竞争中保持领先。

1831 13
|
存储 XML 人工智能
|

深度解读AI在数字档案馆中的创新应用:高效识别与智能档案管理

基于OCR技术的纸质档案电子化方案,通过先进的AI能力平台,实现手写、打印、复古文档等多格式高效识别与智能归档。该方案大幅提升了档案管理效率,确保数据安全与隐私,为档案馆提供全面、智能化的电子化管理解决方案。

1215 48
|
机器学习/深度学习 人工智能 自然语言处理
|

【EMNLP2024】基于多轮课程学习的大语言模型蒸馏算法 TAPIR

阿里云人工智能平台 PAI 与复旦大学王鹏教授团队合作,在自然语言处理顶级会议 EMNLP 2024 上发表论文《Distilling Instruction-following Abilities of Large Language Models with Task-aware Curriculum Planning》。

902 8
|
机器学习/深度学习 人工智能 PyTorch
|

人工智能平台PAI产品使用合集之Alink在PAI上执行时下载依赖库失败,是什么原因

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

300 3
|
存储 机器学习/深度学习 人工智能
|

喜马拉雅基于阿里云机器学习平台PAI-HybridBackend的深度学习模型训练优化实践

喜马拉雅AI云借助阿里云提供的HybridBackend开源框架,实现了其推荐模型在 GPU 上的高效训练。

1417 0
|
机器学习/深度学习 自然语言处理 并行计算
|

全面支持 PyTorch 2.0:BladeDISC 5月~11月新功能发布

BladeDISC 上一次更新主要发布了 GPU AStitch 优化,方法来源于我们发表在 ASPLOS 2022上的论文AStitch。这一次,我们发布了 0.3.0 版本。

1238 0
|
4月前
|
边缘计算 自然语言处理 算法
|

实时交互数字人端到端延迟压至0.8秒:关键技术节点与商业价值解析

0.8秒是实时数字人体验的关键阈值,端到端延迟低于此值可实现自然流畅交互。本文解析其技术链路、核心支撑与商业价值,揭示为何这一指标成为数字人从“可用”到“好用”的分水岭。

453 4
|
7月前
|
人工智能 自然语言处理 运维
|

【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型

阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型,提供企业级部署方案。

580 3
|
8月前
|
人工智能 负载均衡 安全
|

云上AI推理平台全掌握 (3):服务接入与全球调度

阿里云人工智能平台 PAI 平台推出的全球化的服务接入矩阵,为 LLM 服务量身打造了专业且灵活的服务接入方案,正重新定义 AI 服务的高可用接入标准——从单地域 VPC 安全隔离到跨洲际毫秒级调度,让客户的推理服务在任何网络环境下都能实现「接入即最优」。

472 0
|
12月前
|
人工智能 JSON 自然语言处理
|

如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介

阿里云人工智能平台 PAI 推出 PAI-Judge 裁判员大模型,为用户构建符合应用场景的多维度、细粒度的评测体系,支持单模型评测和双模型竞技两种模式,允许用户自定义参数,实现准确、灵活、高效的模型自动化评测,为模型迭代优化提供数据支撑。 相比通用大模型尤其在回答确定性/数学类问题、角色扮演、创意文体写作、翻译等场景下,PAI-Judge 系列模型表现优异,可以直接用于大模型的评估与质检。

1383 8
|
12月前
|
机器学习/深度学习 存储 算法
|

强化学习:蒙特卡罗求解最优状态价值函数——手把手教你入门强化学习(五)

本文介绍了强化学习中的蒙特卡罗算法,包括其基本概念、两种估值方法(首次访问蒙特卡罗与每次访问蒙特卡罗)及增量平均优化方式。蒙特卡罗法是一种基于完整回合采样的无模型学习方法,通过统计经验回报的平均值估计状态或动作价值函数。文章详细讲解了算法流程,并指出其初期方差较大、估值不稳定等缺点。最后对比动态规划,说明了蒙特卡罗法在强化学习中的应用价值。适合初学者理解蒙特卡罗算法的核心思想与实现步骤。

724 4
|
人工智能 自然语言处理 搜索推荐
|

云上玩转DeepSeek系列之三:PAI-RAG集成联网搜索,构建企业级智能助手

本文将为您带来“基于 PAI-RAG 构建 DeepSeek 联网搜索+企业级知识库助手服务”解决方案,PAI-RAG 提供全面的生态能力,支持一键部署至企业微信、微信公众号、钉钉群聊机器人等,助力打造多场景的AI助理,全面提升业务效率与用户体验。

1278 0
|
机器学习/深度学习 人工智能 自然语言处理
|

PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型

DeepSeek 系列模型以其卓越性能在全球范围内备受瞩目,多次评测中表现优异,性能接近甚至超越国际顶尖闭源模型(如OpenAI的GPT-4、Claude-3.5-Sonnet等)。企业用户和开发者可使用 PAI 平台一键部署 DeepSeek 系列模型,实现 DeepSeek 系列模型与现有业务的高效融合。

7773 91
|
消息中间件 API 调度
|

TAG:BladeLLM 的纯异步推理架构

近期,大模型推理社区(vLLM,SGLang 等)普遍开始关注框架运行时开销,提出了多步调度、异步输出处理、独立 API Server 进程等工作,来分摊或掩盖部分开销。 在我们的实际业务场景中,也观察到高额的框架开销严重限制了系统吞吐,特别是在高并发(>1k)场景下,运行时开销已经接近或高于 GPU 运行时间,导致资源严重浪费和性能下降。为此,BladeLLM 设计并实现了基于 Python 的纯异步 LLM 推理架构 -- TAG (Totally Asynchronous Generator) ,以最大程度提高 GPU 利用率,提升引擎性能。

949 3
|
机器学习/深度学习 资源调度 分布式计算
|

阿里PAI-ChatLearn:大规模 Alignment高效训练框架正式开源

PAI-ChatLearn现已全面开源,助力用户快速、高效的Alignment训练体验。借助ChatLearn,用户可全身心投入于模型设计与效果优化,无需分心于底层技术细节。ChatLearn将承担起资源调度、数据传输、参数同步、分布式运行管理以及确保系统高效稳定运作的重任,为用户提供一站式解决方案。

915 10
|
机器学习/深度学习 人工智能 分布式计算
|

人工智能平台PAI使用问题之部署时是否可以自定义资源的区域

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

166 0
|
并行计算 算法 Python
|

Dantzig-Wolfe分解算法解释与Python代码示例

Dantzig-Wolfe分解算法解释与Python代码示例

1321 2
|
机器学习/深度学习 数据采集 算法
|

Python基于低方差特征选择(VarianceThreshold)、遗传算法(TPOTRegressor)实现信用评分卡模型

Python基于低方差特征选择(VarianceThreshold)、遗传算法(TPOTRegressor)实现信用评分卡模型

323 0
|
机器学习/深度学习 数据采集 算法
|

Python实现支持向量机SVM回归模型(SVR算法)项目实战

Python实现支持向量机SVM回归模型(SVR算法)项目实战

1412 4
|
人工智能 编解码 算法
|

使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理

在本教程中,您将学习在阿里云交互式建模平台PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理,实现文本驱动的图像编辑功能单卡即可完成AIGC图片风格变化、背景变化和主体变化等功能。让我们一同开启这场旅程,为您的图像编辑添上无限可能性的翅膀吧。

57565 131
|
机器学习/深度学习 人工智能 异构计算
|

知识蒸馏的基本思路

知识蒸馏(Knowledge Distillation)是一种模型压缩方法,在人工智能领域有广泛应用。目前深度学习模型在训练过程中对硬件资源要求较高,例如采用GPU、TPU等硬件进行训练加速。但在模型部署阶段,对于复杂的深度学习模型,要想达到较快的推理速度,部署的硬件成本很高,在边缘终端上特别明显。而知识蒸馏利用较复杂的预训练教师模型,指导轻量级的学生模型训练,将教师模型的知识传递给学生网络,实现模型压缩,减少对部署平台的硬件要求,可提高模型的推理速度。

1106 0
|
数据采集 机器学习/深度学习 弹性计算
|

【SIGMOD 2023】深度学习弹性数据流水线系统GoldMiner,大幅提升任务和集群效率

阿里云机器学习平台PAI和北京大学杨智老师团队合作的论文被SIGMOD 2023录用。

7835 19
|
SQL 消息中间件 存储
|

尘锋信息基于 Apache Paimon 的流批一体湖仓实践

尘锋信息基于 Apache Paimon 构建流批一体湖仓

14021 1
|
存储 机器学习/深度学习 人工智能
|

【DSW Gallery】DSW基础使用介绍

PAI-DSW是一款云端机器学习开发IDE,为您提供交互式编程环境,适用于不同水平的开发者。本文为您介绍PAI-DSW的功能特点以及界面的基础使用。

2823 0
|
机器学习/深度学习 Web App开发 编解码
|

最高增强至1440p,阿里云发布端侧实时超分工具,低成本实现高画质

近日,阿里云机器学习PAI团队发布一键端侧超分工具,可实现在设备和网络带宽不变的情况下,将移动端视频分辨率提升1倍,最高可增强至1440p,将大幅提升终端用户的观看体验,该技术目前已在优酷、夸克、UC浏览器等多个APP中广泛应用。

2393 0
|
10月前
|
人工智能 自然语言处理 数据库
|

云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 RAG 和联网搜索 的 AI 智能问答应用。该应用通过将 RAG、web search 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了额外的联网搜索和特定领域知识库检索的能力,提升了智能回答的效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。

928 5
|
10月前
|
PyTorch 调度 算法框架/工具
|

阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析

DLC任务Pytorch launch_agent Socket Timeout问题源码分析与解决方案

506 18
|
11月前
|
人工智能 自然语言处理 运维
|

Qwen3 全尺寸模型支持通过阿里云PAI-ModelGallery 一键部署

Qwen3 是 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家(MOE)模型。目前,PAI 已经支持 Qwen3 全系列模型一键部署,用户可以通过 PAI-Model Gallery 快速开箱!

896 0
|
11月前
|
开发者
|

云上玩转DeepSeek系列之六:DeepSeek云端加速版发布,具备超高推理性能

作为国内首个千亿级开源 MoE 模型,DeepSeek-R1 凭借其卓越的代码生成与复杂推理能力,已成为开发者构建智能应用的首选。然而,原始模型在产业落地中面临严峻挑战,部署 671B 满血版模型不仅硬件门槛要求很高,同时吞吐效率和响应延迟也受到了制约。PAI 正式推出了优化版 DeepSeek-R1 模型 DeepSeek-R1-PAI-optimized,将大模型推理效率推向了 Next Level。

535 11
|
存储 人工智能 自然语言处理
|

云上玩转DeepSeek系列之二:PAI+DeepSeek,打造智能问答助手

本文将为您带来“PAI+DeepSeek,30分钟打造支持连网搜索+私有知识库的智能应用”最佳实践,大模型能力、联网能力再加持 RAG 方案,实现 DeepSeek 系列模型与现有业务的高效融合。

1273 16
|
人工智能 自然语言处理 算法
|

DeepSeek模型的突破:性能超越R1满血版的关键技术解析

上海AI实验室周伯文团队的最新研究显示,7B版本的DeepSeek模型在性能上超越了R1满血版。该成果强调了计算最优Test-Time Scaling的重要性,并提出了一种创新的“弱到强”优化监督机制的研究思路,区别于传统的“从强到弱”策略。这一方法不仅提升了模型性能,还为未来AI研究提供了新方向。

1618 9
|
机器学习/深度学习 人工智能 自然语言处理
|

云上一键部署 DeepSeek-V3 模型,阿里云 PAI-Model Gallery 最佳实践

本文介绍了如何在阿里云 PAI 平台上一键部署 DeepSeek-V3 模型,通过这一过程,用户能够轻松地利用 DeepSeek-V3 模型进行实时交互和 API 推理,从而加速 AI 应用的开发和部署。

5374 32
|
机器学习/深度学习 人工智能 数据处理
|

[python 技巧] 快速掌握Streamlit: python快速原型开发工具

本文旨在快速上手python的streamlit库,包括安装,输入数据,绘制图表,基础控件,进度条,免费部署。

1829 64
|
机器学习/深度学习 算法
|

Physics Informed Deep Learning (Part I): Data-driven Solutions of Nonlinear Partial Differential Equations

将神经网络内容,增加物理条件限制

783 2
|
人工智能 固态存储 调度
|

【Paper Reading】结合 NanoFlow 研究,优化大语言模型服务效率的探索

本文将深入探讨 NanoFlow 的关键思路和核心技术,分析 NanoFlow 与 阿里云人工智能平台 PAI 在实际工作中应用的潜力。

782 7
|
人工智能 分布式计算 大数据
|

AI Native平台,跨越AI应用从创新到生产的鸿沟

2024年是AI应用的元年,以大模型为中心的 AI Native 应用大爆发正在从理想变成现实。云计算带来的应用创新潮,经历了虚拟机时代和云原生时代,正在全面拥抱以大模型为核心的 AI Native 阶段,推动大数据与AI的工作流前所未有地紧密结合。领先大模型、高效的AI计算平台和统一的大数据平台是 AI Native 应用广泛落地背后不可获缺的要素。 9月20日,2024云栖大会上,阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布大数据AI平台全面升级,为 AI Native 应用大爆发提供坚实的平台支撑。

2086 4
|
机器学习/深度学习 数据采集 算法
|

Python实现GBDT(梯度提升树)回归模型(GradientBoostingRegressor算法)项目实战

Python实现GBDT(梯度提升树)回归模型(GradientBoostingRegressor算法)项目实战

680 6
|
机器学习/深度学习 人工智能 负载均衡
|

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型(LLM)实现与训练优化上的创新工作。

2010 8
|
Windows
|

Coze开源软件Windows客户端-coze_desk

Coze开源软件Windows客户端-coze_desk

2435 0
我要发布