机器学习平台PAI-产品问答-汇集知识碎片解决技术难题-阿里云开发者社区-阿里云

开发者社区> 大数据和机器学习> 机器学习平台PAI
机器学习平台PAI
关注
7
今日
761
内容
3
活动
2464
关注
【玩转数据系列二】机器学习应用没那么难,这次教你玩心脏病预测
心脏病是人类健康的头号杀手。全世界1/3的人口死亡是因心脏病引起的,而我国,每年有几十万人死于心脏病。 所以,如果可以通过提取人体相关的体侧指标,通过数据挖掘的方式来分析不同特征对于心脏病的影响,对于预测和预防心脏病将起到至关重要的作用。本文将会通过真实的数据,通过阿里云机器学习平台搭建心脏病预测案
24529 0
【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分
机器学习算法基于信用卡消费记录做信用评分 背景 如果你是做互联网金融的,那么一定听说过评分卡。评分卡是信用风险评估领域常用的建模方法,评分卡并不简单对应于某一种机器学习算法,而是一种通用的建模框架,将原始数据通过分箱后进行特征工程变换,继而应用于线性模型进行建模的一种方法。
12069 0
阿里大航杯AI电力大赛比赛分享及数加平台,机器学习pai使用经验
本文主要以阿里云大航杯“智造扬中”电力AI大赛 数据为背景,讲述博主自己的比赛经历以及数加平台和机器学习pai的使用经验
9873 0
【上报纸啦】95后大学生用机器学习PAI大战老年痴呆
中国青年报原文链接:http://zqb.cyol.com/html/2017-07/28/nw.D110000zgqnb_20170728_2-06.htm 燕山大学信息科学与技术专业出身的95后大学生谭创创,没想到自己会与阿尔茨海默症(俗称“老年痴呆症”)为“敌”。
8596 0
【教程】5分钟在PAI算法市场发布自定义算法
概述 在人工智能领域存在这样的现象,很多用户有人工智能的需求,但是没有相关的技术能力。另外有一些人工智能专家空有一身武艺,但是找不到需求方。这意味着在需求和技术之间需要一种连接作为纽带。 今天PAI正式对外发布了“AI市场”以及“PAI自定义算法”两大功能,可以帮助用户5分钟将线下的spark算法或是pyspark算法发布成算法组件,并且支持组件发布到AI市场供更多用户使用。
8540 0
[EuroSys2023 Best Poster] 面向动态图的极低时延GNN推理采样服务
GraphLearn团队和浙大联合发表的论文被评选为EuroSys2023 best poster。
6550 1
大规模深度学习优化技术在PAI平台中的应用及实践
工业界和学术界也先后推出了用于Deep Learning建模用途的多种开源工具和框架,这里详细解读下阿里云推出的PAI(Platform of Artificial Intelligence)。其致力于通过系统与算法协同优化的方式,来有效解决Deep Learning训练工具的使用效率问题,目前PAI集成了TensorFlow、Caffe、MXNet这三款流行的Deep Learning框架,并针对这几款框架做了定制化的性能优化支持,以求更好的解决用户建模的效率问题。
6652 0
阿里云机器学习平台PAI,助力降低机器学习的成本和技术门槛
摘要:在2017杭州云栖大会机器学习平台PAI专场上,阿里巴巴研究员、阿里云机器学习平台PAI负责人林伟为大家分享了人工智能的发展历史以及阿里云机器学习平台PAI的简单情况和特性。   本文内容根据嘉宾演讲视频以及PPT整理而成。
5746 0
2684亿销售额背后的阿里AI技术
刚刚结束的双十一,天猫交易额达到 2684 亿元,较去年同比增长 25.7%。这一结果背后,云计算、人工智能等技术以及阿里巴巴工程师们的努力功不可没。在正在召开的 AICon 全球人工智能与机器学习技术大会 现场,阿里云智能计算平台事业部研究员林伟介绍了阿里基于飞天 AI 平台的人工智能技术及能力,揭开双 11 大规模交易场景下,阿里人工智能技术的神秘面纱。
5083 0
人民的名义分析
人民的名义台本分析<br />数据源:人民的名义台本<br />数据大小:77.8 KB<br />字段数量:2<br />使用组件:读数据表<br />
3707 0
CTR中的GBDT与LR算法融合
在广告点击机器学习实践中, 我们用的最多的是逻辑回归(LR)模型,使用大量的特征做为训练数据输入。 特征的组合非常关键,我们无法穷举这些组合,只能依赖于人工经验来判断,耗时耗力同时带来的效果可能还不好。 如何自动的发现有效的特征,是机器学习实践中要解决的问题。 Facebook 曾经介绍了使用GBDT与LR组合的方法,可以有效的解决这个问题,今天的课程就为大家讲解如何在PAI上实现GBDT与LR的融合。<br />数据源:<br />数据大小:770 KB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
2163 0
揭秘工业级大规模GNN图采样
互联网下的图数据纷繁复杂且规模庞大,如何将GNN应用于如此复杂的数据上呢?答案是图采样。结合阿里巴巴开源的GNN框架Graph-Learn(https://github.com/alibaba/graph-learn),本文重点介绍GNN训练过程中的各种图采样和负采样技术。
2696 0
利用PAI-DSW访问Github, 快速获取最新的学习资源
PAI-DSW(Data science workshop)是专门为数据科学探索者们准备的云端深度学习开发环境,用户可以登录 DSW 进行代码的开发并运行工作。目前 DSW 支持了Github下载,让我们可以更加便捷的访问上面的资源.
3527 0
脚把脚教你利用PAI训练出自己的CNN手写识别模型并部署为可用的服务
虽然已经 9102 年了,MNIST手写数据集也早已经被各路神仙玩出了各种花样,比如其中比较秀的有用MINST训练手写日语字体的。但是目前还是很少有整体的将训练完之后的结果部署为一个可使用的服务的。大多数还是停留在最终Print出一个Accuracy。
2757 0
【文本分析】新闻分类_860
发二娃fa'e'w<br />数据源:各位<br />数据大小:261 KB<br />字段数量:3<br />使用组件:过滤与映射,SQL脚本,读数据表,增加序号列,类型转换<br />
1114 0
test_multiEvaluation
实验名称实验名称实验名称<br />数据源:实验名称<br />数据大小:779 KB<br />字段数量:42<br />使用组件:读数据表<br />
944 0
心脏病预测案例_1480
分享到云栖社区<br />数据源:test<br />数据大小:7.49 KB<br />字段数量:15<br />使用组件:归一化,拆分,SQL脚本,读数据表,类型转换<br />
809 0
玩转AIGC | 5分钟使用PAI一键部署Stable Diffusion AI绘画应用
本文将展示如何通过阿里云机器学习PAI 快速部署SD文生图模型并启动WebUI 进行推理服务。
12435 0
心脏病预测案例_3048
心脏病是人类健康的头号杀手。全世界1/3的人口死亡是因心脏病引起的,而我国,每年有几十万人死于心脏病。 所以,如果可以通过提取人体相关的体侧指标,通过数据挖掘的方式来分析不同特征对于心脏病的影响,对于预测和预防心脏病将起到至关重要的作用。本文将会通过真实的数据,通过阿里云机器学习平台搭建心脏病预测案例。<br />数据源:<br />数据大小:7.49 KB<br />字段数量:15<br />使用组件:读数据表,类型转换,SQL脚本,归一化,拆分,过滤式特征选择<br />
825 0
文本分类
文本分类实验<br />数据源:<br />数据大小:261 KB<br />字段数量:3<br />使用组件:拆分,SQL脚本,读数据表,JOIN,增加序号列,类型转换,合并列<br />
808 0
文本分类
文本分析实验<br />数据源:<br />数据大小:261 KB<br />字段数量:3<br />使用组件:拆分,SQL脚本,读数据表,JOIN,增加序号列,类型转换,合并列<br />
714 0
【评分卡】信用卡消费分析_230
测试测试<br />数据源:<br />数据大小:1.36 MB<br />字段数量:25<br />使用组件:分箱,读数据表,评分卡预测,评分卡训练,拆分,样本稳定指数(PSI)<br />
751 0
pinjiu
利用机器学习PAI对酒水数据分类<br />数据源:酒水数据<br />数据大小:192 KB<br />字段数量:12<br />使用组件:归一化,主成分分析(PCA),拆分,SQL脚本,读数据表<br />
733 0
CTR_GBDT_LR_TEST
实战分享:CTR中的GBDT+LR融合方案<br />数据源:internet<br />数据大小:770 KB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
725 0
心脏病预测案例_1480
gawgew<br />数据源:<br />数据大小:7.49 KB<br />字段数量:15<br />使用组件:DNN训练,归一化,拆分,SQL脚本,读数据表,类型转换<br />
718 0
GBDT_LR
CTR中的GBDT+LR融合方案<br />数据源:<br />数据大小:770 KB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
774 0
【推荐算法】商品推荐_1450
测试一下功能<br />数据源:<br />数据大小:328 KB<br />字段数量:4<br />使用组件:过滤与映射,SQL脚本,读数据表,JOIN<br />
718 0
del
123<br />数据源:123<br />数据大小:7.22 KB<br />字段数量:16<br />使用组件:读数据表<br />
664 0
CTR_GBDT_LR
基于CTR的GBDT和LR方法融合<br />数据源:直播提供数据<br />数据大小:770 KB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
719 0
原来GNN这么好上手,OMG!用它!
GraphLearn(GL)是阿里巴巴开源的一个大规模图神经网络平台,本文将对GL的接口做基本介绍,帮助用户快速上手。项目地址:https://github.com/alibaba/graph-learn 。
1616 0
predict_with_binary_class_log
GBDT<br />数据源:<br />数据大小:7.49 KB<br />字段数量:15<br />使用组件:拆分,SQL脚本,读数据表,标准化,类型转换<br />
596 0
lesson1
本人小白,初次学习PAI,欢迎和大家一起交流学习这个PAI学习。阿里API直播课程的“手把手在线直播实操:机器学习PAI教你如何品酒”,我这边也就是学习一下。<br />数据源:<br />数据大小:96.1 KB<br />字段数量:12<br />使用组件:归一化,拆分,SQL脚本,读数据表<br />
572 0
【评分卡】信用卡消费分析_209
test<br />数据源:<br />数据大小:1.36 MB<br />字段数量:25<br />使用组件:分箱,样本稳定指数(PSI),评分卡训练,拆分,评分卡预测,读数据表<br />
602 0
lr
第一次尝试 LR<br />数据源:<br />数据大小:770 KB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
598 0
【评分卡】0925_信用卡消费分析_215
0925_信用卡消费分析_215<br />数据源:<br />数据大小:1.36 MB<br />字段数量:25<br />使用组件:分箱,样本稳定指数(PSI),评分卡训练,拆分,评分卡预测,读数据表<br />
607 0
CTR_GBDT_LR
融合方案<br />数据源:<br />数据大小:770 KB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
465 0
【推荐算法】商品推荐_2587
asdf<br />数据源:asdf<br />数据大小:328 KB<br />字段数量:4<br />使用组件:Filter and Mapping,JOIN,Read ODPS table,SQL Script<br />
423 0
大数据&AI产品月刊【2023年5月】
大数据&AI产品技术月刊(2023年5月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
6649 0
Apache Paimon 在同程旅行的探索实践
本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。
2373 0
使用 PAI-Blade 优化 Stable Diffusion 推理流程
PAI-Blade是 PAI 推出的通用推理优化工具,可以通过模型系统联合优化,使模型达到最优推理性能。
4532 0
使用 PAI-Blade 优化 Stable Diffusion 推理流程(二)
本篇我们继续介绍使用 PAI-Blade 优化 LoRA 和 Controlnet 的推理流程。相关优化已经同样在 registry.cn-beijing.aliyuncs.com/blade_demo/blade_diffusion镜像中可以直接使用。同时,我们将介绍 Stable-Diffusion-webui 中集成 PAI-Blade 优化的方法。
5165 1
PAI-Diffusion中文模型全面升级,海量高清艺术大图一键生成
PAI-Diffusion中文模型大幅升级,本文详细介绍PAI-Diffusion中文模型的新功能和新特性。
5454 1
【ASPLOS 2023】图神经网络统一图算子抽象uGrapher,大幅提高计算性能
近日,阿里云机器学习PAI平台关于图神经网络统一高性能IR的论文《uGrapher》被系统领域顶会ASPLOS 2023接收。
296 0
【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类
伴随着今日阿里云机器学习PAI在云栖大会的重磅发布,快来感受下人工智能的魅力。 一、背景 随着互联网的发展,产生了大量的图片以及语音数据,如何对这部分非结构化数据行之有效的利用起来,一直是困扰数据挖掘工程师的一到难题。
45643 0
【DSW Gallery】基于ModelScope的中文GPT-3模型(1.3B)的微调训练
本文基于ModelScope,以GPT-3(1.3B)为例介绍如何使用ModelScope-GPT3进行续写训练与输入输出形式的训练,训练方式不需要额外指定,训练数据集仅包含 src_txt 时会进行续写训练,同时包含 src_txt 和 tgt_txt 时会进行输入输出形式的训练。
657 0
【玩转数据系列十五】机器学习PAI为你自动写歌词,妈妈再也不用担心我的freestyle了(提供数据、代码)
背景 最近互联网上出现一个热词就是“freestyle”,源于一个比拼rap的综艺节目。在节目中需要大量考验选手的freestyle能力,freestyle指的是rapper即兴的根据一段主题讲一串rap。
16991 0
尘锋信息基于 Apache Paimon 的流批一体湖仓实践
尘锋信息基于 Apache Paimon 构建流批一体湖仓
11411 1
机器学习平台PAI简测:PAI提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务
机器学习平台PAI(Platform of Artificial Intelligence)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
421 0
我要发布