人工智能平台PAI
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
EasyNLP集成K-Global Pointer算法,支持中文信息抽取
K-Global Pointer的技术解读,以及如何在EasyNLP框架中使⽤K-Global Pointer模型。
🎁重磅豪礼!机器学习平台PAI + AI开源项目等你来评测!
为PAI + AI开源项目撰写评测,赢取《AI技术分享会》栏目录制机会、LAMY钢笔套装、hero手冲咖啡壶套装、阿里云社区评测官奖杯、阿里云社区首页达人展示一周、开发者评测限量版T恤、30元猫超卡等豪礼!
DataWorks管控台无法配置PAI引擎临时解决方案
大数据开发治理平台 DataWorks基于MaxCompute/EMR/MC-Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。在DataWorks工作空间配置PAI引擎后机器学习才能对接DataWorks然后PAI引用MaxCompute表作为数据源进行模型训练。之前DW空间支持一键关联开通PAI,DW新改版因为对管控台一体化流程的改进,这个功能会挪到小扳手。由于目前这个功能还未开发完毕,所以就给之前创建空间后未开通PAI的客户带来了很多困扰,本文临时性提供一下解决方案,以供正常使用。
【DSW Gallery】如何在DLC上提交ElasticBatch任务
ElasticBatch是一种分布式离线弹性批量推理作业类型, 本文将介绍ElasticBatch SDK接口以及如何在DLC上提交ElasticBatch任务。
【DSW Gallery】基于残差网络的度量学习示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文以度量学习为例,为您介绍如何在PAI-DSW中使用EasyCV。
阿里云PAI-Diffusion功能再升级,全链路支持模型调优,平均推理速度提升75%以上
本⽂首先介绍如何体验PAI-Diffusion模型以及其在线部署、加速推理能力。其次,我们简单回顾了PAI-Diffusion模型的架构,之后详细介绍了在EasyNLP算法框架中对上述模型进行调优的全链路支持。
PAI子账号(RAM用户)创数据集NAS存储相关权限授予Quick Start
机器学习平台PAI(Platform of Artificial Intelligence)是面向企业客户及开发者,提供轻量化、高性价比的云原生机器学习。是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。而高质量的数据集是高精度模型的基础,是数据准备的核心目标。阿里云PAI提供数据集管理模块,支持将各类数据(本地数据、阿里云存储中的数据等)注册为数据集,为智能标注、模型训练做准备。但是很多公司RAM用户虽然可以正常点击创建,然而在填写NAS路径时往往又碰到权限问题。本文简单演示一下NAS存储相关权限授予,以供参考。
YOLOX升级 | 阿里巴巴提出YOLOX-PAI,1ms内精度无敌,超越YOLOv6、PP-YOLOE
YOLOX升级 | 阿里巴巴提出YOLOX-PAI,1ms内精度无敌,超越YOLOv6、PP-YOLOE
【AI技术分享会第8期】EMNLP 2022 小样本学习论文解读来啦!开年直播好礼相送
阿里云AI技术分享会第八期《【EMNLP 2022】小样本学习论文解读》将在2023年2月8日晚18:00开启直播,精彩不容错过!
机器学习平台PAI子账号(RAM用户)数据集相关权限授予
机器学习平台PAI(Platform of Artificial Intelligence)是面向企业客户及开发者,提供轻量化、高性价比的云原生机器学习。是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。而高质量的数据集是高精度模型的基础,是数据准备的核心目标。阿里云PAI提供数据集管理模块,支持将各类数据(本地数据、阿里云存储中的数据等)注册为数据集,为智能标注、模型训练做准备。但是很多公司RAM用户在创建及管理数据集过程中因为对平台比较陌生常常会遇到权限相关问题,本文介绍创建过程中常见的一个权限问题,以供参考。
基于单机最高能效270亿参数GPT模型的文本生成与理解
针对GPT基础模型参数量大,训练&推理硬件资源消耗过高等问题,我们采用GPT+MoE的技术架构路线,探索单机最高能效的绿色低碳GPT大模型训练&推理软硬一体化适配技术在中文文本生成场景的落地可行性。
LeetCode 373. Find K Pairs with Smallest Sums
给定两个以升序排列的整形数组 nums1 和 nums2, 以及一个整数 k。 定义一对值 (u,v),其中第一个元素来自 nums1,第二个元素来自 nums2。 找到和最小的 k 对数字 (u1,v1), (u2,v2) ... (uk,vk)。
LeetCode 336. Palindrome Pairs
给定一组唯一的单词, 找出所有不同 的索引对(i, j),使得列表中的两个单词, words[i] + words[j] ,可拼接成回文串。
BEVFormer-accelerate:基于EasyCV加速BEVFormer
BEVFormer是一种纯视觉的自动驾驶感知算法,通过融合环视相机图像的空间和时序特征显式的生成具有强表征能力的BEV特征,并应用于下游3D检测、分割等任务,取得了SOTA的结果。
模型精度再被提升,统一跨任务小样本学习算法 UPT 给出解法!
UPT是一种面向多种NLP任务的小样本学习算法,致力于利用多任务学习和预训练增强技术,在仅需要标注极少训练数据的情况下,提升大规模预训练语言模型在多种场景下的模型精度。
PAI-Diffusion 模型来了!阿里云机器学习团队带您徜徉中文艺术海洋
PAI-Diffusion系列模型,包括一系列通用场景和特定场景的文图生成模型,本⽂简要介绍PAI-Diffusion模型及其体验方式。
全面支持 PyTorch 2.0:BladeDISC 5月~11月新功能发布
BladeDISC 上一次更新主要发布了 GPU AStitch 优化,方法来源于我们发表在 ASPLOS 2022上的论文AStitch。这一次,我们发布了 0.3.0 版本。
Span抽取和元学习能碰撞出怎样的新火花,小样本实体识别来告诉你!
这是一种面向命名实体识别的小样本学习算法,采用两阶段的训练方法,检测文本中最有可能是命名实体的Span,并且准确判断其实体类型,在仅需要标注极少训练数据的情况下,提升预训练语言模型在命名实体识别任务上的精度。
算法 KECP 被顶会 EMNLP 收录,极少训练数据就能实现机器阅读理解
KECP 是一种面向机器阅读理解的小样本学习算法,采用 Prompt-Tuning 作为基础学习范式,在仅需要标注极少训练数据的情况下,在给定文章中抽取满足要求的文本作为答案。
阿里云机器学习 PAI 年度发布:持续锻造云原生的 AI 工程平台
刚刚结束的 2022 云栖大会上,阿里云机器学习平台 PAI 发布了在开发者服务、企业级能力、工程性能优化三个方向的一系列新特性和功能。从支撑达摩院上云,到服务金融、汽车、互联网、制造等多个行业的创新实践,机器学习 PAI 不断夯实云原生的 AI 工程平台能力。
阿里云开源大数据产品年度发布
阿里云开源大数据一直坚持兼容并蓄,百花齐放的产品理念,面向大数据的未来进行投资和发展。今年开源大数据E-MapReduce、Flink、Elasticsearch 等产品矩阵再次升级,向着开放化、现代化、智能化和云原生的高质量发展迈进。
效率优先,DataWorks全链路数据治理年度发布
基于阿里云强大的大数据AI一体化的平台能力,从工具层面,介绍DataWorks端到端的全链路数据开发治理平台新能力,回归工具为人服务的本质,全方位地提升一线数据开发人员/业务人员的工作效率。
一体化大数据智能计算平台 ODPS 产品年度发布
阿里云ODPS全新升级,存储、调度、元数据一体化融合 ,从 Processing 升级为 Platform,即 Open Data Platform and Service。本次峰会,同步发布了新的产品能力,即MaxCompute 引擎新功能发布及Hologres 引擎新功能发布。
UC CV类模型优化总结
CV模型是业务中常见的模型,但是我们观察到UC集群中的CV类模型还有很大的GPU利用率提升空间。如果不对此进行优化,则需要大量的GPU资源才能才能满足延迟要求。本文主要介绍了CV类模型的优化总结。
使用EasyCV Mask2Former轻松实现图像分割
EasyCV可以轻松预测图像的分割谱以及训练定制化的分割模型。本文主要介绍如何使用EasyCV实现实例分割、全景分割和语义分割,及相关算法思想。
【DSW Gallery】 基于EasyCV的Mask2Former图像分割示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文将介绍使用EasyCV进行图像分割模型的训练和预测。
2022 世界互联网大会:阿里云 ODPS 入选世界互联网领先科技成果
ODPS 解决了用户多元化数据的计算需求问题,实现了存储、调度、元数据管理上的一体化架构融合,支撑交通、金融、科研、政府等多场景数据的高效处理,是目前国内最早自研、应用最为广泛的一体化大数据平台。
当大火的文图生成模型遇见知识图谱,AI画像趋近于真实世界
模型免费开放!零基础也能一键进行AI艺术创作。本⽂简要介绍ARTIST的技术解读,以及如何在EasyNLP框架中使⽤ARTIST模型。
阿里云机器学习平台 PAI宣布集成国产深度学习框架 OneFlow
在云栖大会上,阿里云机器学习PAI平台宣布集成自研深度学习框架OneFlow,进一步提升对国产算法框架的支持。PAI可以在架构上实现包括对国际主流、国内自研在内的任何第三方深度学习框架的支持。