人工智能平台PAI
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
【AI技术分享会第8期】EMNLP 2022 小样本学习论文解读来啦!开年直播好礼相送
阿里云AI技术分享会第八期《【EMNLP 2022】小样本学习论文解读》将在2023年2月8日晚18:00开启直播,精彩不容错过!
国内唯一!阿里云机器学习平台PAI同时入选Gartner两项权威报告
日前,国际权威研究机构 Gartner 连续发布两份 AI 领域研究报告,阿里云机器学习平台 PAI 蝉联上榜。
算法 KECP 被顶会 EMNLP 收录,极少训练数据就能实现机器阅读理解
KECP 是一种面向机器阅读理解的小样本学习算法,采用 Prompt-Tuning 作为基础学习范式,在仅需要标注极少训练数据的情况下,在给定文章中抽取满足要求的文本作为答案。
一体化大数据智能计算平台 ODPS 产品年度发布
阿里云ODPS全新升级,存储、调度、元数据一体化融合 ,从 Processing 升级为 Platform,即 Open Data Platform and Service。本次峰会,同步发布了新的产品能力,即MaxCompute 引擎新功能发布及Hologres 引擎新功能发布。
使用EasyCV Mask2Former轻松实现图像分割
EasyCV可以轻松预测图像的分割谱以及训练定制化的分割模型。本文主要介绍如何使用EasyCV实现实例分割、全景分割和语义分割,及相关算法思想。
阿里云2022金秋云创季大数据AI双11优惠
阿里云2022金秋云创季开启,双11期间大数据&AI产品超值优惠,爆款Elasticsearch、DataWorks指定规格1元起,更有多款产品年度优惠,还可叠加阿里云双11跨品类满减优惠券,最高减2400元,欢迎您来选购!
【DSW Gallery】Tensorflow 2构建CNN模型
本文基于TensorFlow2版本,构建了一个CNN网络,然后基于Mnist手写体数据集进行手写体的识别。本文从模型的定义,数据的加载,处理,模型的训练到最后的结果的分析以及可视化等方面提供了一个端到端的sample。用户可以基于本文了解使用TensorFlow2进行模型开发的整个流程。
【DSW Gallery】基于EasyNLP的RoBERTa中文文本匹配
EasyNLP提供多种模型的训练及预测功能,旨在帮助自然语言开发者方便快捷地构建模型并应用于生产。本文以中文文本匹配为例,为您介绍如何在PAI-DSW中基于EasyNLP快速使用RoBERTa进行文本匹配模型的训练、推理。
【DSW Gallery】基于EasyNLP的英文文本摘要
EasyNLP提供多种模型的训练及预测功能,旨在帮助自然语言开发者方便快捷地构建模型并应用于生产。本文以英文文本摘要为例,为您介绍如何在PAI-DSW中使用EasyNLP。
EasyCV带你复现更好更快的自监督算法-FastConvMAE
近期FastConvMAE工作在EasyCV框架内首次对外开源,本文将重点介绍ConvMAE和FastConvMAE的主要工作,以及对应的代码实现,最后提供详细的教程示例如何进行FastConvMAE的预训练和下游任务的finetune。
【DSW Gallery】基于EasyNLP的MacBERT中文机器阅读理解
EasyNLP提供多种模型的训练及预测功能,旨在帮助自然语言开发者方便快捷地构建模型并应用于生产。本文以机器阅读理解任务为例,为您介绍如何在PAI-DSW中基于EasyNLP快速使用MacBERT进行中文机器阅读理解模型的训练、推理。
【DSW Gallery】特征平台
特征平台是专门用来存储,共享,管理机器学习模型特征的存储库。特征平台可以方便的向多人、多团队共享特征,提供安全,高效且统一的存储,保证离线在线的一致性。
【DSW Gallery】数据分析经典案例:Kaggle竞赛之房价预测
Python是目前当之无愧的数据分析第一语言,大量的数据科学家使用Python来完成各种各样的数据科学任务。本文以Kaggle竞赛中的房价预测为例,结合JupyterLab Notebook,完成数据加载、数据探索、数据可视化、数据清洗、特征分析、特征处理、机器学习、回归预测等步骤,主要Python工具是Pandas和SKLearn。本文中仅仅使用了线性回归这一最基本的机器学习模型,读者可以自行尝试其他更加复杂模型,比如随机森林、支持向量机、XGBoost等。
地址标准化服务AI深度学习模型推理优化实践
深度学习已在面向自然语言处理等领域的实际业务场景中广泛落地,对它的推理性能优化成为了部署环节中重要的一环。推理性能的提升:一方面,可以充分发挥部署硬件的能力,降低用户响应时间,同时节省成本;另一方面,可以在保持响应时间不变的前提下,使用结构更为复杂的深度学习模型,进而提升业务精度指标。
大数据&AI产品月刊【2022年7月】
大数据&AI产品技术月刊(2022年7月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
【ICDE 2022】稀疏模型训练框架HybridBackend,单位成本下训练吞吐提升至5倍
近日,阿里巴巴投稿的论文《PICASSO: Unleashing the Potential of GPU-centric Training for Wide-and-deep Recommender Systems》被数据库和数据挖掘方向CCF-A类国际三大顶会之一的ICDE 2022 (International Conference on Data Engineering) 接收。
【GTC 22】PaiSparse:面向深度学习的稀疏算子库
随着越来越多超大语言模型的出现,如何将这些超大语言模型在实际业务中部署落地成为了一个急需解决的问题。这些超大语言模型拥有百亿千亿甚至于万亿的参数,如此巨大的参数使得无法将超大模型直接部署在单张卡上,而需要几个甚至几十个 GPU 参与模型推理,会消耗非常大的计算资源。然而一些常用的模型优化技术如剪枝和量化虽然能够有效的降低模型大小,但是这些算法却很难在保证精度的情况下达到较大的压缩率。因此我们选择了非结构化稀疏来压缩超大语言模型,从而使得他们能够在保证精度的情况下达到较高的压缩率。
贾扬清领衔,阿里多人入选全球人工智能最具影响力学者榜单
近日,2022年度人工智能最具影响力学者榜单正式发布,在21个AI子领域中,阿里云计算平台负责人贾扬清等10名阿里科学家成功入选。其中,贾扬清在多媒体领域排名第一。
AICompiler动态shape编译框架
欢迎走进走进阿里云机器学习PAI AICompiler编译器系列。近期,阿里云机器学习PAI团队全新上线一套Dynamic Shape Compiler框架,不仅作为AICompiler技术栈中原有的Static Shape Compiler框架的重要补充,更是增加了Compiler在企业级数据处理应用的无限可能,在提升数据处理效率的同时,大幅提升AI工程化效率。
机器学习PAI 2020-3 月刊
PAI 2020-3月 产品月刊为您带来3月机器学习PAI产品:数据集管理及标注工具发布、自动特征探索算法发布、EAS资源组临时扩容功能上线及印度region支持DSW、PAI-TF组件等最新资讯。
CTR 实验之二:GBDT 与LR 算法融合
通过GBDT生成的特征与原始特征进行merge,然后通过LR做回归。<br />数据源:<br />数据大小:770 KB<br />字段数量:20<br />使用组件:Table to KV,SQL脚本,拆分,读数据表,特征编码,增加序号列<br />
CTR中的GBDT+LR 融合方案_副本
实现GBDT与LR的融合<br />数据源:<br />数据大小:1.54 MB<br />字段数量:20<br />使用组件:拆分,读数据表,特征编码<br />
TextClassify_01_filter_stop_words
在 PAI 平台上使用组件完成文本分类任务<br />数据源:Internet<br />数据大小:94.6 KB<br />字段数量:3<br />使用组件:拆分,SQL脚本,读数据表,JOIN,增加序号列,类型转换,合并列<br />
【图算法】金融风控实验_997
jjljljlkjlj<br />数据源:<br />数据大小:896 B<br />字段数量:3<br />使用组件:SQL脚本,读数据表,JOIN<br />
【推荐算法】商品推荐_1450
测试一下功能<br />数据源:<br />数据大小:328 KB<br />字段数量:4<br />使用组件:过滤与映射,SQL脚本,读数据表,JOIN<br />
【成功】从一列标题中进行高频词提取
从一列标题中进行高频词提取<br />数据源:从一列标题中进行高频词提取<br />数据大小:139 KB<br />字段数量:1<br />使用组件:写数据表,读数据表,增加序号列<br />
QuickSSO有哪些高级功能
QuickSSO是2021年发布的统一身份认证平台,基于OAuth2.0标准,旨在解决企业多应用账号繁杂、登录繁琐和管理分散等问题。其核心功能包括单点登录与应用整合、统一身份与权限管控、多场景协同办公(如即时通讯、网盘、审批流程)以及全面审计与多端适配。平台支持易接入部署,适配各类企业及政务场景,典型案例如与ECreator低代码工具协同搭建客户管理系统,实现高效身份认证与权限管控,是企业数字化转型的重要工具。
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
聊聊最近在阿里云的云应用开发平台(CAP)上的体验
CAP 快速部署项目体验评测:选择了 RAG 模板,配置过程顺畅但遇到数据源兼容性问题;使用 PTS 测试性能良好,监控和弹性策略配置友好;用 Flask 进行二次开发顺利,用户体验提升;建议增加实时数据处理、机器学习模型服务等热门场景模板。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【KDD2024】面向集群整体作业运行变慢的异常检测
阿里云计算平台大数据基础工程技术团队主导,与浙江大学合作的论文《Cluster-Wide Task Slowdown Detection in Cloud System》被数据挖掘领域顶会ACM SIGKDD2024接收。论文从新的视角分析云计算平台集群健康状态,实现了基于神经网络的集群作业整体变慢异常定向检测,与SOTA异常检测算法相比平均提升F1 score 5.3%。
人工智能发展之路:探寻未来科技的疆界
自计算机科学诞生,人工智能始终是探索焦点。历经逻辑推理、专家系统至深度学习时代,AI在图像、语音识别等领域取得突破。未来,AI将在医疗、教育、交通等领域发挥更大作用,如辅助精准医疗、个性化教学及解决交通问题。同时,AI还将促进跨界融合创新,与物联网、云计算结合,推动智能家居、智慧城市的发展,并使机器人、无人机更智能化。面对伦理、隐私等挑战,需确保技术惠及人类,共同创造美好未来。
人工智能平台PAI使用问题之如何指定线上分区表的分区格式
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
人工智能平台PAI使用问题之如何在MaxCompute上使用Protobuf处理数据
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
人工智能平台PAI使用问题之一直显示"正在等待在云端的gateway资源",该如何处理
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
人工智能平台PAI使用问题之分箱指的是什么
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
人工智能平台PAI使用问题之如何添加权限
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
人工智能平台PAI使用问题之如何实现数据在MaxCompute中是永久的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
人工智能平台PAI使用问题之Java SDK支持哪些版本
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
妙笔生词与网易天音:写歌词的优势对决
妙笔生词(veve522)与网易天音在歌词创作中各具优势。妙笔擅长专业韵律,个性化定制;网易天音倚靠技术与市场资源,创造流行趋势并勇于创新。两者满足不同创作风格与需求。
妙笔生词智能写歌词软件:创新助力还是艺术之殇?
妙笔生词智能写歌词软件(veve522)提供便捷高效的灵感框架,适应多种音乐风格,但可能缺乏情感深度。作为辅助工具,它能与人类创造力结合,激发更多音乐作品。该软件是科技与艺术融合的尝试,旨在助力音乐创作的多元化。
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机分类模型(SVC算法)项目实战
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机分类模型(SVC算法)项目实战