人工智能平台PAI
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
【DSW Gallery】基于EasyCV的文字识别示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文以文字识别为例,为您介绍如何在PAI-DSW中使用EasyCV。
【DSW Gallery】基于EasyCV的BEVFormer 3D检测示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文将以BEVFormer 3D检测为例,为您介绍如何在PAI-DSW中使用EasyCV。
【DSW Gallery】基于残差网络的度量学习示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文以度量学习为例,为您介绍如何在PAI-DSW中使用EasyCV。
机器学习平台PAI子账号(RAM用户)数据集相关权限授予
机器学习平台PAI(Platform of Artificial Intelligence)是面向企业客户及开发者,提供轻量化、高性价比的云原生机器学习。是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。而高质量的数据集是高精度模型的基础,是数据准备的核心目标。阿里云PAI提供数据集管理模块,支持将各类数据(本地数据、阿里云存储中的数据等)注册为数据集,为智能标注、模型训练做准备。但是很多公司RAM用户在创建及管理数据集过程中因为对平台比较陌生常常会遇到权限相关问题,本文介绍创建过程中常见的一个权限问题,以供参考。
LeetCode 373. Find K Pairs with Smallest Sums
给定两个以升序排列的整形数组 nums1 和 nums2, 以及一个整数 k。 定义一对值 (u,v),其中第一个元素来自 nums1,第二个元素来自 nums2。 找到和最小的 k 对数字 (u1,v1), (u2,v2) ... (uk,vk)。
LeetCode 336. Palindrome Pairs
给定一组唯一的单词, 找出所有不同 的索引对(i, j),使得列表中的两个单词, words[i] + words[j] ,可拼接成回文串。
阿里云开源大数据产品年度发布
阿里云开源大数据一直坚持兼容并蓄,百花齐放的产品理念,面向大数据的未来进行投资和发展。今年开源大数据E-MapReduce、Flink、Elasticsearch 等产品矩阵再次升级,向着开放化、现代化、智能化和云原生的高质量发展迈进。
2022 世界互联网大会:阿里云 ODPS 入选世界互联网领先科技成果
ODPS 解决了用户多元化数据的计算需求问题,实现了存储、调度、元数据管理上的一体化架构融合,支撑交通、金融、科研、政府等多场景数据的高效处理,是目前国内最早自研、应用最为广泛的一体化大数据平台。
阿里云ODPS升级为一体化大数据平台,满足用户多元化数据计算需求
11月3日,2022云栖大会上,阿里巴巴集团副总裁、阿里云计算平台事业部负责人贾扬清表示,为满足用户多元化数据计算需求,阿里云ODPS升级为一体化大数据平台。
EasyNLP发布融合语言学和事实知识的中文预训练模型CKBERT
本⽂简要介绍CKBERT的技术解读,以及如何在EasyNLP框架、HuggingFace Models和阿里云机器学习平台PAI上使⽤CKBERT模型。
【DSW Gallery】基于图算法实现金融风控
图算法一般被用来解决关系网状的业务场景。与常规的结构化数据不同,图算法需要把数据整理成首尾相连的关系图谱,更多的是考虑边和点的概念。这里提供了丰富的图算法组件,包括K-Core、最大联通子图、标签传播聚类等。本示例是使用人物关系图数据,和少量标记用户数据,基于图算法实现金融风控。
【DSW Gallery】交替最小二乘算法解决推荐相关问题
ALS (Alternating Lease Square)交替最小二乘法是一种model based的协同过滤算法, 用于对评分矩阵进行因子分解,然后预测user对item的评分。 它通过观察到的所有用户给产品的打分,来推断每个用户的喜好并向用户推荐适合的产品。
【DSW Gallery】使用 Alink 结合 TFDV 进行数据探索和验证
Alink 提供了对大规模数据的高效统计,能提供数量、缺失值、最大最小值、分位数、分布直方图等各种统计指标,用户可以探索数据特征,并为特征工程提供辅助。Alink 还能无缝结合 TensorFlow Data Validation,提供数据 schema 推断、数据偏移检测等功能。
【DSW Gallery】HybridBackend 极简教程: 在 GPU 上加速推荐模型训练
本文介绍了如何使用 HybridBackend 在 GPU 上加速一个示例推荐模型的训练。HybridBackend 是阿里巴巴提供的一个工业级稀疏模型训练框架,可以帮助用户轻松提升GPU上的稀疏模型训练的计算吞吐。
EasyNLP带你实现中英文机器阅读理解
本⽂将提供对MacBERT模型的技术解读,以及如何在EasyNLP框架中使⽤MacBERT及其他预训练语言模型,进行中英文机器阅读理解任务的训练与预测。
【DSW Gallery】基于EasyNLP的BERT文本分类
EasyNLP提供多种模型的训练及预测功能,旨在帮助自然语言开发者方便快捷地构建模型并应用于生产。本文以文本分类为例,为您介绍如何在PAI-DSW中基于EasyNLP快速使用BERT进行文本分类模型的训练、推理。
【DSW Gallery】基于YOLOX模型图像检测示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文以YOLOX模型图像检测为例,为您介绍如何在PAI-DSW中使用EasyCV。
预约直播 | 基于预训练模型的自然语言处理及EasyNLP算法框架
阿里云AI技术分享会第三期《基于预训练模型的自然语言处理及EasyNLP算法框架》将在2022年08月24日晚18:00-18:30直播,精彩不容错过!
直播回放含 PPT 下载 | 基于 Flink & DeepRec 构建 Online Deep Learning
基于 Flink & DeepRec 构建 Online Deep Learning专场的直播回放和PPT下载
再突破!阿里云进入Gartner云AI开发者服务挑战者象限
凭借达摩院领先的AI算法和阿里云丰富的产品体系,继2021年入围远见者象限之后,阿里云进一步跃升至挑战者象限,且成为报告中执行能力最强的中国企业。
最新活动!机器学习PAI:企业AI加速计划(第一期)
最新活动,企业AI加速计划开启!两大权益等您来领: 1)参加PAI-DSW闭门直播课; 2)价值500元的PAI-DSW产品代金券
MAE 自监督算法介绍和基于 EasyCV 的复现
自监督学习(Self-Supervised Learning)能利用大量无标注的数据进行表征学习,然后在特定下游任务上对参数进行微调。通过这样的方式,能够在较少有标注数据上取得优于有监督学习方法的精度。近年来,自监督学习受到了越来越多的关注,如Yann Lecun也在 AAAI 上讲 Self-Supervised Learning 是未来的大势所趋。在CV领域涌现了如SwAV、MOCO、DINO、MoBY等一系列工作。MAE是kaiming继MOCO之后在自监督学习领域的又一力作。首先,本文会对MAE进行解读,然后基于EasyCV库的精度复现过程及其中遇到的一些问题作出解答。
预训练知识度量比赛夺冠!阿里云PAI发布知识预训练工具
阿里云计算平台PAI团队携手达摩院智能对话与服务技术团队,在CCIR Cup2021全国信息检索挑战杯的《预训练模型知识量度量》比赛中基于自研的融入知识预训练模型取得第一名。团队采用自研的知识预训练模型KGBERT和DKPLM为底座,采用多样化知识融入方法,形成强有力的蕴含丰富知识的预训练模型,在比赛数据上取得了非常好的效果。
持续探索行业新趋势,PAI平台获得联邦学习评测证书
2021 年 6 月 24 日,阿里云机器学习平台PAI获得“大数据产品能力评测”联邦学习项目基础能力专项评测证书,持续探索行业新趋势,不断在前沿的热门领域尝试AI应用落地。
尼日利亚的学生开发者,用阿里云PAI打造了卡通头像神器
在国内外的各大社交平台上,卡通头像已经成为了一种风潮。但如何才能自己打造一款快速生成卡通化照片的神器呢?前不久,来自尼日利亚的学生开发者Abdul-Hadi Hashim就基于阿里云的多款产品开发出了这样一款名叫3D Animate Hub的小工具,并在首届阿里云全球AI创新挑战赛中获得了二等奖。
知乎李大海对话阿里云贾扬清:透视AI应用难题与未来趋势
“AI行业接下来可能有哪些发展?” “一线从业者如何看待其中的机会?”近日,知乎合伙人、CTO李大海与阿里巴巴副总裁、阿里云智能高级研究员贾扬清亮相知乎直播,与网友分享了他们对AI时代下行业趋势、技术应用、个人成长等多个层面的洞察和思考。
数据科学老司机在线开车系列: 如何自己训练一个热狗识别模型
前情提要 美剧《硅谷》大家想必都没怎么看过,大家可能都不知道人工智能识别热狗曾是硅谷最赚钱的技术之一。去年 HBO 发布了官方的 Not Hotdog 应用,支持 iOS 和 Android 平台,据说是用 TensorFlow、Keras 和 React Native 打造的,但是源码没有公开。
农业贷款预测的回归算法实现_0
ljkkjjk<br />数据源:<br />数据大小:6.62 KB<br />字段数量:10<br />使用组件:读数据表,线性回归(旧),SQL脚本,过滤与映射,合并列<br />
【通知】阿里云机器学习PAI即将商业化
【通知】阿里云机器学习PAI即将商业化 尊敬的机器学习PAI用户 感谢您一直以来对PAI的支持,从2015年开始,PAI平台和许多深度学习的爱好者一起成长,PAI始终坚持为深度学习用户带来更好的服务与支持,在2018年1月17日,PAI将正式商业化升级,以0元的价格为华东深度学习用户继续提供服务,华北区用户可以通过付费享受独有的计算资源。
阿里云机器学习平台PAI,助力降低机器学习的成本和技术门槛
摘要:在2017杭州云栖大会机器学习平台PAI专场上,阿里巴巴研究员、阿里云机器学习平台PAI负责人林伟为大家分享了人工智能的发展历史以及阿里云机器学习平台PAI的简单情况和特性。 本文内容根据嘉宾演讲视频以及PPT整理而成。
asd【文本分析】新闻分类aaa_2493
流控流控流控流控<br />数据源:<br />数据大小:261 KB<br />字段数量:3<br />使用组件:读数据表,类型转换,过滤与映射,增加序号列,合并列<br />
【推荐算法】商品推荐_2587
asdf<br />数据源:adsf<br />数据大小:328 KB<br />字段数量:4<br />使用组件:过滤与映射,SQL脚本,读数据表,JOIN<br />
predict_with_binary_class_log
GBDT<br />数据源:<br />数据大小:7.49 KB<br />字段数量:15<br />使用组件:拆分,SQL脚本,读数据表,标准化,类型转换<br />
【推荐算法】商品推荐_1652
测试<br />数据源:<br />数据大小:328 KB<br />字段数量:4<br />使用组件:过滤与映射,SQL脚本,读数据表,JOIN<br />
【图算法】金融风控实验
本文的业务场景如下: 已知的一份人物通联关系图,每两个人之间的连线表示两人有一定关系,可以是同事关系或者亲人关系等。已知“Enoch”是信用用户,"Evan"是欺诈用户,计算出其它人的信用指数。通过图算法,可以算出图中每个人是欺诈用户的概率,这个数据可以方便相关机构做风控。<br />数据源:风控数据<br />数据大小:896 B<br />字段数量:3<br />使用组件:SQL脚本,读数据表,JOIN<br />