人工智能平台PAI
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
LeetCode 373. Find K Pairs with Smallest Sums
给定两个以升序排列的整形数组 nums1 和 nums2, 以及一个整数 k。 定义一对值 (u,v),其中第一个元素来自 nums1,第二个元素来自 nums2。 找到和最小的 k 对数字 (u1,v1), (u2,v2) ... (uk,vk)。
LeetCode 336. Palindrome Pairs
给定一组唯一的单词, 找出所有不同 的索引对(i, j),使得列表中的两个单词, words[i] + words[j] ,可拼接成回文串。
2022 世界互联网大会:阿里云 ODPS 入选世界互联网领先科技成果
ODPS 解决了用户多元化数据的计算需求问题,实现了存储、调度、元数据管理上的一体化架构融合,支撑交通、金融、科研、政府等多场景数据的高效处理,是目前国内最早自研、应用最为广泛的一体化大数据平台。
【DSW Gallery】基于图算法实现金融风控
图算法一般被用来解决关系网状的业务场景。与常规的结构化数据不同,图算法需要把数据整理成首尾相连的关系图谱,更多的是考虑边和点的概念。这里提供了丰富的图算法组件,包括K-Core、最大联通子图、标签传播聚类等。本示例是使用人物关系图数据,和少量标记用户数据,基于图算法实现金融风控。
【DSW Gallery】交替最小二乘算法解决推荐相关问题
ALS (Alternating Lease Square)交替最小二乘法是一种model based的协同过滤算法, 用于对评分矩阵进行因子分解,然后预测user对item的评分。 它通过观察到的所有用户给产品的打分,来推断每个用户的喜好并向用户推荐适合的产品。
【DSW Gallery】Tensorflow 2构建CNN模型
本文基于TensorFlow2版本,构建了一个CNN网络,然后基于Mnist手写体数据集进行手写体的识别。本文从模型的定义,数据的加载,处理,模型的训练到最后的结果的分析以及可视化等方面提供了一个端到端的sample。用户可以基于本文了解使用TensorFlow2进行模型开发的整个流程。
【DSW Gallery】HybridBackend 极简教程: 在 GPU 上加速推荐模型训练
本文介绍了如何使用 HybridBackend 在 GPU 上加速一个示例推荐模型的训练。HybridBackend 是阿里巴巴提供的一个工业级稀疏模型训练框架,可以帮助用户轻松提升GPU上的稀疏模型训练的计算吞吐。
EasyCV带你复现更好更快的自监督算法-FastConvMAE
近期FastConvMAE工作在EasyCV框架内首次对外开源,本文将重点介绍ConvMAE和FastConvMAE的主要工作,以及对应的代码实现,最后提供详细的教程示例如何进行FastConvMAE的预训练和下游任务的finetune。
【DSW Gallery】基于EasyNLP的MacBERT中文机器阅读理解
EasyNLP提供多种模型的训练及预测功能,旨在帮助自然语言开发者方便快捷地构建模型并应用于生产。本文以机器阅读理解任务为例,为您介绍如何在PAI-DSW中基于EasyNLP快速使用MacBERT进行中文机器阅读理解模型的训练、推理。
【DSW Gallery】基于YOLOX模型图像检测示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文以YOLOX模型图像检测为例,为您介绍如何在PAI-DSW中使用EasyCV。
【DSW Gallery】DSW实例管理
PAI-DSW是一款云端机器学习开发IDE,为您提供交互式编程环境,适用于不同水平的开发者。本文介绍在控制台如何管理使用DSW实例,包括如何创建,停止,启动,以及设置定时关机等操作。
阿里灵杰融合智能算力,全栈AI服务为探索者铺路
阿里灵杰大数据AI一体化平台提供全流程的开发和运维服务。尤其在模型训练和推理性能、大数据与AI工程能力方面,凭借技术领先性和丰富落地实践,成为区别传统AI集群的独特优势所在。
预约直播 | 基于预训练模型的自然语言处理及EasyNLP算法框架
阿里云AI技术分享会第三期《基于预训练模型的自然语言处理及EasyNLP算法框架》将在2022年08月24日晚18:00-18:30直播,精彩不容错过!
地址标准化服务AI深度学习模型推理优化实践
深度学习已在面向自然语言处理等领域的实际业务场景中广泛落地,对它的推理性能优化成为了部署环节中重要的一环。推理性能的提升:一方面,可以充分发挥部署硬件的能力,降低用户响应时间,同时节省成本;另一方面,可以在保持响应时间不变的前提下,使用结构更为复杂的深度学习模型,进而提升业务精度指标。
直播回放含 PPT 下载 | 基于 Flink & DeepRec 构建 Online Deep Learning
基于 Flink & DeepRec 构建 Online Deep Learning专场的直播回放和PPT下载
再突破!阿里云进入Gartner云AI开发者服务挑战者象限
凭借达摩院领先的AI算法和阿里云丰富的产品体系,继2021年入围远见者象限之后,阿里云进一步跃升至挑战者象限,且成为报告中执行能力最强的中国企业。
【GTC 22】PaiSparse:面向深度学习的稀疏算子库
随着越来越多超大语言模型的出现,如何将这些超大语言模型在实际业务中部署落地成为了一个急需解决的问题。这些超大语言模型拥有百亿千亿甚至于万亿的参数,如此巨大的参数使得无法将超大模型直接部署在单张卡上,而需要几个甚至几十个 GPU 参与模型推理,会消耗非常大的计算资源。然而一些常用的模型优化技术如剪枝和量化虽然能够有效的降低模型大小,但是这些算法却很难在保证精度的情况下达到较大的压缩率。因此我们选择了非结构化稀疏来压缩超大语言模型,从而使得他们能够在保证精度的情况下达到较高的压缩率。
预训练知识度量比赛夺冠!阿里云PAI发布知识预训练工具
阿里云计算平台PAI团队携手达摩院智能对话与服务技术团队,在CCIR Cup2021全国信息检索挑战杯的《预训练模型知识量度量》比赛中基于自研的融入知识预训练模型取得第一名。团队采用自研的知识预训练模型KGBERT和DKPLM为底座,采用多样化知识融入方法,形成强有力的蕴含丰富知识的预训练模型,在比赛数据上取得了非常好的效果。
持续探索行业新趋势,PAI平台获得联邦学习评测证书
2021 年 6 月 24 日,阿里云机器学习平台PAI获得“大数据产品能力评测”联邦学习项目基础能力专项评测证书,持续探索行业新趋势,不断在前沿的热门领域尝试AI应用落地。
尼日利亚的学生开发者,用阿里云PAI打造了卡通头像神器
在国内外的各大社交平台上,卡通头像已经成为了一种风潮。但如何才能自己打造一款快速生成卡通化照片的神器呢?前不久,来自尼日利亚的学生开发者Abdul-Hadi Hashim就基于阿里云的多款产品开发出了这样一款名叫3D Animate Hub的小工具,并在首届阿里云全球AI创新挑战赛中获得了二等奖。
知乎李大海对话阿里云贾扬清:透视AI应用难题与未来趋势
“AI行业接下来可能有哪些发展?” “一线从业者如何看待其中的机会?”近日,知乎合伙人、CTO李大海与阿里巴巴副总裁、阿里云智能高级研究员贾扬清亮相知乎直播,与网友分享了他们对AI时代下行业趋势、技术应用、个人成长等多个层面的洞察和思考。
体验机器学习PAI-DSW动手实验室,赢取价值20000大礼包及定制T恤衫
动手体验数据科学,成为PAI-DSW探索者!快来体验机器学习PAI-DSW动手实验室,测一测你的相亲战斗力指数,还能赢取价值20000大礼包及定制T恤衫!
数据科学老司机在线开车系列: 如何自己训练一个热狗识别模型
前情提要 美剧《硅谷》大家想必都没怎么看过,大家可能都不知道人工智能识别热狗曾是硅谷最赚钱的技术之一。去年 HBO 发布了官方的 Not Hotdog 应用,支持 iOS 和 Android 平台,据说是用 TensorFlow、Keras 和 React Native 打造的,但是源码没有公开。
【直播】机器学习就用PAI,带你一起现场训练热狗识别模型!
看过美剧《硅谷》的同学都知道人工智能识别热狗曾是硅谷最赚钱的技术之一。去年 HBO 发布了官方的 Not Hotdog 应用,支持 iOS 和 Android 平台,据说是用 TensorFlow、Keras 和 React Native 打造的,但是源码没有公开。
农业贷款预测的回归算法实现_0
ljkkjjk<br />数据源:<br />数据大小:6.62 KB<br />字段数量:10<br />使用组件:读数据表,线性回归(旧),SQL脚本,过滤与映射,合并列<br />
阿里云机器学习平台PAI,助力降低机器学习的成本和技术门槛
摘要:在2017杭州云栖大会机器学习平台PAI专场上,阿里巴巴研究员、阿里云机器学习平台PAI负责人林伟为大家分享了人工智能的发展历史以及阿里云机器学习平台PAI的简单情况和特性。 本文内容根据嘉宾演讲视频以及PPT整理而成。
【推荐算法】商品推荐_3041
asdfsadf eee<br />数据源:<br />数据大小:328 KB<br />字段数量:4<br />使用组件:读数据表,SQL脚本,JOIN,过滤与映射<br />
asd【文本分析】新闻分类aaa_2493
流控流控流控流控<br />数据源:<br />数据大小:261 KB<br />字段数量:3<br />使用组件:读数据表,类型转换,过滤与映射,增加序号列,合并列<br />
【推荐算法】商品推荐_2587
asdf<br />数据源:adsf<br />数据大小:328 KB<br />字段数量:4<br />使用组件:过滤与映射,SQL脚本,读数据表,JOIN<br />
CTR_GBDT_LR_TEST
CTR中的GBDT+LR融合方案<br />数据源:internet<br />数据大小:770 KB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
【推荐算法】商品推荐_2244
对所有用户购买商品的行为和购买的商品做出统计,使用协同过滤算法进行操作,最后统计出用户和商品之间的关系,基于二者的关系进行商品推荐<br />数据源:虚拟测试数据<br />数据大小:328 KB<br />字段数量:4<br />使用组件:过滤与映射,SQL脚本,读数据表,JOIN<br />
【成功】从一列标题中进行高频词提取
从一列标题中进行高频词提取<br />数据源:从一列标题中进行高频词提取<br />数据大小:139 KB<br />字段数量:1<br />使用组件:写数据表,读数据表,增加序号列<br />
【图算法】金融风控实验
本文的业务场景如下: 已知的一份人物通联关系图,每两个人之间的连线表示两人有一定关系,可以是同事关系或者亲人关系等。已知“Enoch”是信用用户,"Evan"是欺诈用户,计算出其它人的信用指数。通过图算法,可以算出图中每个人是欺诈用户的概率,这个数据可以方便相关机构做风控。<br />数据源:风控数据<br />数据大小:896 B<br />字段数量:3<br />使用组件:SQL脚本,读数据表,JOIN<br />
人工智能发展之路:探寻未来科技的疆界
自计算机科学诞生,人工智能始终是探索焦点。历经逻辑推理、专家系统至深度学习时代,AI在图像、语音识别等领域取得突破。未来,AI将在医疗、教育、交通等领域发挥更大作用,如辅助精准医疗、个性化教学及解决交通问题。同时,AI还将促进跨界融合创新,与物联网、云计算结合,推动智能家居、智慧城市的发展,并使机器人、无人机更智能化。面对伦理、隐私等挑战,需确保技术惠及人类,共同创造美好未来。
人工智能平台PAI使用问题之worker的events没有合并是什么原因
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。