备案控制台

开发者社区问答正文

如何在主数据集中找到X_train索引?

在Python中，我们可以通过Sklearn函数将数据集分割为X_train、y_train。

X_train, X_test, y_train, y_test = train_test_split(X, y, shuffle=True, test_size=0.3)

我的问题是:如何在数据集中找到X_train或y_train索引? 假设我们通过

prediction = model.predict(X_test)

另外，我们如何找到预测的指标? 我这样问是因为我想看到每一行的值当我得到不准确的结果。换句话说，数据是主数据集，子集是数据的子集数据=数组([0,1,2,3,4,5,6,7,8,9]) subest = array([2,4,5,6]) 如何在数据中找到子集的索引? 问题来源StackOverflow 地址：/questions/59384457/how-can-i-find-x-train-indexes-in-the-main-dataset

展开

收起

kun坤 2019-12-26 14:38:51 630 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

如sklearn.model_selection中所述。train_test_split，是sklearn.model_select . shufflesplit的快速应用:

from sklearn.model_selection import ShuffleSplit, train_test_split

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=1, test_size=1)
x_train
array([[2, 3],
       [8, 9],
       [0, 1],
       [6, 7]])

这是由ShuffleSplit的拆分索引集产生的收益:

train_ind, test_ind = next(ShuffleSplit(random_state=1).split(X, y))
X[train_ind]
array([[2, 3],
       [8, 9],
       [0, 1],
       [6, 7]])

你可以使用train_ind和/或由ShuffleSplit生成的test_ind，它和使用train_test_split是一样的

2019-12-26 14:38:57

赞同展开评论

问答分类：

索引 Python

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83663

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3705

1

0

sql server的用户名和密码怎么查啊？

37503

21

0

重启Docker后报错：Error response from daemon

2293

0

0

this xml file does not appear to have any style in

51861

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60922

32

0

OSS的endpoint如何查看

37487

6

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3647

1

0

阿里云服务器如何重置系统？

24718

4

0

LoRa的网络覆盖能力范围是怎么样的？

3153

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？

存储系统：从检索技术角度剖析 LevelDB 的架构设计思想

搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

还有其他疑问?