《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)

简介: 《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(下)

《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(上) https://developer.aliyun.com/article/1232671?groupCode=supportservice



二、DSW实现简单算法:K-近邻

我们通过身高体重两个维度指标,判定一个人的健康状态是优还是差。这里我们手动造一些训练数据,通过计算,最终计算测试人的健康状态。


1.打开Notebook


image.png


2.Python Code


#引入依赖,并以字典方式创建数据集
import pandas as pd
get_data={'姓名':['甲','乙','丙','丁','戊','己','庚','辛'],'身高(cm)':[140,145,190,188,175,166,152,181],'体重(kg)
':[90,48,80,78,45,95,55,70],'健康状态':['异常','正常','正常','正常','异常','异常','正常','正常']}
#看下数据内容
train_data=pd.DataFrame(get_data)
train_data


image.png


#计算下已知的数据与每个点之间的距离
test_data=[180,75]
train_data.iloc[:len(train_data),1:3]


image.png


dist = list((((train_data.iloc[:len(train_data),1:3]-test_data)**2).sum(1))**0.5)
dist


image.png



#升序排列,取距离最小的K个点,这里取k为4
k=4
dist_l = pd.DataFrame({'dist':dist,'labels':(train_data.iloc[:len(train_data),3])})
dr = dist_l.sort_values(by='dist')[:4]
dr


image.png


#确定前K个点中,健康状态的频率
re = dr.loc[:,'labels'].value_counts()
re.index[0]


image.png



####封装下函数
import pandas as pd
def classfy0(inx,dataSet,k):
 result=[]
 dist = list((((dataSet.iloc[:len(train_data),1:3]-inx)**2).sum(1))**0.5)
 dist_l = pd.DataFrame({'dist':dist,'labels':(dataSet.iloc[:8,3])})
 dr = dist_l.sort_values(by='dist')[:k]
 re = dr.loc[:,'labels'].value_counts()
 result.append(re.index[0])
 return result


image.png

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
6月前
|
人工智能 文字识别 监控
|
6月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3564 166
|
6月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
2430 120
|
6月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
6月前
|
人工智能 数据处理 API
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。
1127 6
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
|
6月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
6月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
1068 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
6月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。

热门文章

最新文章

下一篇
开通oss服务