《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)

《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(上) https://developer.aliyun.com/article/1232671?groupCode=supportservice



二、DSW实现简单算法:K-近邻

我们通过身高体重两个维度指标,判定一个人的健康状态是优还是差。这里我们手动造一些训练数据,通过计算,最终计算测试人的健康状态。


1.打开Notebook


image.png


2.Python Code


#引入依赖,并以字典方式创建数据集
import pandas as pd
get_data={'姓名':['甲','乙','丙','丁','戊','己','庚','辛'],'身高(cm)':[140,145,190,188,175,166,152,181],'体重(kg)
':[90,48,80,78,45,95,55,70],'健康状态':['异常','正常','正常','正常','异常','异常','正常','正常']}
#看下数据内容
train_data=pd.DataFrame(get_data)
train_data


image.png


#计算下已知的数据与每个点之间的距离
test_data=[180,75]
train_data.iloc[:len(train_data),1:3]


image.png


dist = list((((train_data.iloc[:len(train_data),1:3]-test_data)**2).sum(1))**0.5)
dist


image.png



#升序排列,取距离最小的K个点,这里取k为4
k=4
dist_l = pd.DataFrame({'dist':dist,'labels':(train_data.iloc[:len(train_data),3])})
dr = dist_l.sort_values(by='dist')[:4]
dr


image.png


#确定前K个点中,健康状态的频率
re = dr.loc[:,'labels'].value_counts()
re.index[0]


image.png



####封装下函数
import pandas as pd
def classfy0(inx,dataSet,k):
 result=[]
 dist = list((((dataSet.iloc[:len(train_data),1:3]-inx)**2).sum(1))**0.5)
 dist_l = pd.DataFrame({'dist':dist,'labels':(dataSet.iloc[:8,3])})
 dr = dist_l.sort_values(by='dist')[:k]
 re = dr.loc[:,'labels'].value_counts()
 result.append(re.index[0])
 return result


image.png

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
4月前
|
人工智能 并行计算 数据中心
NVIDIA智算中心“产品”上市,AI工业革命的iPhone时刻
NVIDIA智算中心“产品”上市,AI工业革命的iPhone时刻
|
22天前
|
存储 人工智能 分布式计算
大数据& AI 产品月刊【2024年10月】
大数据& AI 产品技术月刊【2024年10月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
2月前
|
SQL 存储 人工智能
【产品升级】Dataphin V4.3重大升级:AI“弄潮儿”,数据资产智能化
DataAgent如何助理业务和研发成为业务参谋?如何快速低成本的创建行业数据分类标准?如何管控数据源表的访问权限?如何满足企业安全审计需求?
607 1
【产品升级】Dataphin V4.3重大升级:AI“弄潮儿”,数据资产智能化
|
3月前
|
存储 人工智能 运维
重磅!阿里云可观测产品家族全新升级,AI +数据双驱动,打造全栈可观测体系
近日,阿里云可观测产品家族正式发布云监控 2.0,隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。
390 19
|
2月前
|
消息中间件 人工智能 Cloud Native
|
2月前
|
人工智能 自然语言处理 搜索推荐
【云栖实录】大模型驱动,开源融合的AI搜索产品发布
本文介绍了2024云栖大会上,阿里云发布的年度AI搜索产品详情。
192 8
|
2月前
|
人工智能 分布式计算 大数据
大数据&AI产品月刊【2024年9月】
大数据& AI 产品技术月刊【2024年9月】,涵盖本月技术速递、2024云栖大会实录、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
3月前
|
消息中间件 人工智能 Cloud Native
|
3月前
|
人工智能 算法 大数据
懂场景者得AI,瓴羊发布年度产品智能化战略
9月20日,瓴羊智能科技(以下简称瓴羊)在2024云栖大会上举办了“Data × AI:企业服务智能化,价值增长新动能”专场论坛。阿里巴巴集团副总裁、瓴羊智能科技CEO 朋新宇在会上发布年度产品智能化战略:“(算法 + 算力 + 数据) x 场景 ”,强调企业必须重视场景,只有通过解构场景、重构业务,才能真正拥抱AI,带来突破性增长。
100 14
|
3月前
|
消息中间件 人工智能 运维