《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)

《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(上) https://developer.aliyun.com/article/1232671?groupCode=supportservice



二、DSW实现简单算法:K-近邻

我们通过身高体重两个维度指标,判定一个人的健康状态是优还是差。这里我们手动造一些训练数据,通过计算,最终计算测试人的健康状态。


1.打开Notebook


image.png


2.Python Code


#引入依赖,并以字典方式创建数据集
import pandas as pd
get_data={'姓名':['甲','乙','丙','丁','戊','己','庚','辛'],'身高(cm)':[140,145,190,188,175,166,152,181],'体重(kg)
':[90,48,80,78,45,95,55,70],'健康状态':['异常','正常','正常','正常','异常','异常','正常','正常']}
#看下数据内容
train_data=pd.DataFrame(get_data)
train_data


image.png


#计算下已知的数据与每个点之间的距离
test_data=[180,75]
train_data.iloc[:len(train_data),1:3]


image.png


dist = list((((train_data.iloc[:len(train_data),1:3]-test_data)**2).sum(1))**0.5)
dist


image.png



#升序排列,取距离最小的K个点,这里取k为4
k=4
dist_l = pd.DataFrame({'dist':dist,'labels':(train_data.iloc[:len(train_data),3])})
dr = dist_l.sort_values(by='dist')[:4]
dr


image.png


#确定前K个点中,健康状态的频率
re = dr.loc[:,'labels'].value_counts()
re.index[0]


image.png



####封装下函数
import pandas as pd
def classfy0(inx,dataSet,k):
 result=[]
 dist = list((((dataSet.iloc[:len(train_data),1:3]-inx)**2).sum(1))**0.5)
 dist_l = pd.DataFrame({'dist':dist,'labels':(dataSet.iloc[:8,3])})
 dr = dist_l.sort_values(by='dist')[:k]
 re = dr.loc[:,'labels'].value_counts()
 result.append(re.index[0])
 return result


image.png

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
20小时前
|
文字识别 JavaScript Java
印刷文字识别产品使用合集之阿里云文字识别OCR demo主要有哪些
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
56 0
|
1天前
|
弹性计算 分布式计算 Hadoop
Linux(阿里云)安装Hadoop(详细教程+避坑)
Linux(阿里云)安装Hadoop(详细教程+避坑)
19 3
|
2天前
|
人工智能 自然语言处理 JavaScript
阿里云发布 AI 编程助手 “通义灵码”——VSCode更强了 !!
阿里云发布 AI 编程助手 “通义灵码”——VSCode更强了 !!
22 3
|
2天前
|
Cloud Native 数据库
阿里云产品四月刊来啦
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代,详情请点击阿里云产品四月刊
阿里云产品四月刊来啦
|
2天前
|
人工智能 API
阿里云微服务引擎及 API 网关 2024 年 4 月产品动态
阿里云微服务引擎及 API 网关 2024 年 4 月产品动态。
|
2天前
|
运维 Cloud Native 应用服务中间件
阿里云微服务引擎 MSE 及 API 网关 2024 年 04 月产品动态
阿里云微服务引擎 MSE 面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持 Nacos/ZooKeeper/Eureka )、云原生网关(原生支持Higress/Nginx/Envoy,遵循Ingress标准)、微服务治理(原生支持 Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。API 网关 (API Gateway),提供 APl 托管服务,覆盖设计、开发、测试、发布、售卖、运维监测、安全管控、下线等 API 生命周期阶段。帮助您快速构建以 API 为核心的系统架构.满足新技术引入、系统集成、业务中台等诸多场景需要。
|
2天前
|
机器学习/深度学习 数据采集 人工智能
机器学习之sklearn基础教程
【5月更文挑战第9天】Sklearn是Python热门机器学习库,提供丰富算法和预处理工具。本文深入讲解基础概念、核心理论、常见问题及解决策略。内容涵盖模型选择与训练、预处理、交叉验证、分类回归、模型评估、数据集划分、正则化、编码分类变量、特征选择与降维、集成学习、超参数调优、模型评估、保存加载及模型解释。学习Sklearn是迈入机器学习领域的关键。
23 3
|
2天前
|
Cloud Native 关系型数据库 分布式数据库
数据库性能诊断工具DBdoctor通过阿里云PolarDB产品生态集成认证
DBdoctor(V3.1.0)成功通过阿里云PolarDB分布式版(V2.3)集成认证,展现优秀兼容性和稳定性。此工具是聚好看科技的内核级数据库性能诊断产品,运用eBPF技术诊断SQL执行,提供智能巡检、根因分析和优化建议。最新版V3.1.1增加了对PolarDB-X和OceanBase的支持,以及基于cost的索引诊断功能。PolarDB-X是阿里巴巴的高性能云原生分布式数据库,兼容MySQL生态。用户可通过提供的下载地址、在线试用链接和部署指南体验DBdoctor。
|
2天前
|
Prometheus 监控 数据可视化
阿里云可观测 2024 年 4 月产品动态
阿里云可观测 2024 年 4 月产品动态。
|
2天前
|
Java 关系型数据库 MySQL
保姆级教程——将springboot项目部署到阿里云服务器包含环境配置(小白包会)
本文档详细介绍了将SpringBoot项目部署到阿里云服务器的步骤。首先,通过Xshell连接服务器,使用公网IP地址。接着,下载JDK的Linux版本,使用XFTP上传并解压,配置环境变量。然后,安装MySQL 5.7,包括下载YUM源、安装、启动服务以及修改root密码和开启远程访问。最后,将SpringBoot项目打包成jar,上传至服务器,使用`java -jar`命令运行,通过`nohup`确保服务持续运行。配置安全组以允许远程访问。

热门文章

最新文章