EasyRec用于特征选择的命令和参数解释 easy_rec/python/tools/feature_selection.py

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: EasyRec用于特征选择的命令和参数解释

pai -name easy_rec_ext
-Dres_project='your_project’
-Dversion='0.8.0'
-Dcmd='custom'
-DentryFile='easy_rec/python/tools/feature_selection.py'
-Dextra_params='--config_path oss://{your_oss}/xxx/pipeline.config --output_dir oss://{your_oss}/xxx/output_1 --topk 1000 --visualize'
-Darn='acs:ram::{your_aliyun_id}:role/aliyunodpspaidefaultrole'
-Dbuckets='oss://{your_oss}/'
-DossHost='oss-cn—beijing-internal.aliyuncs.com'
;

-Dres_project='your_project’ 表示你上次的EasyRec包在你自己的MaxCompute项目空间中,其中版本是version='0.8.0'。

cmd='custom' 表示指定执行脚本:entryFile='easy_rec/python/tools/feature_selection.py'
extra_params 是指feature_selection.py 需要的参数

{your_aliyun_id} 是的阿里云账号数字id
{your_oss} 是你的oss bucket名称
ossHost 是oss 的endpoint,其中internal.aliyuncs.com表示内网用的域名。

相关文章
|
3月前
|
机器学习/深度学习 存储 算法
五、分类模型及超参数调优
五、分类模型及超参数调优
28 0
|
8月前
|
数据可视化 Python
PYTHON贝叶斯推断计算:用BETA先验分布推断概率和可视化案例
PYTHON贝叶斯推断计算:用BETA先验分布推断概率和可视化案例
|
8月前
|
存储 监控 算法
R语言贝叶斯非参数模型:密度估计、非参数化随机效应META分析心肌梗死数据
R语言贝叶斯非参数模型:密度估计、非参数化随机效应META分析心肌梗死数据
|
8月前
|
机器学习/深度学习 算法 Python
探索XGBoost:参数调优与模型解释
探索XGBoost:参数调优与模型解释
424 2
|
8月前
|
机器学习/深度学习 前端开发 算法
基于Python的随机森林(RF)回归与多种模型超参数自动优化方法
基于Python的随机森林(RF)回归与多种模型超参数自动优化方法
194 1
|
8月前
|
机器学习/深度学习 算法 Python
【Python机器学习】Sklearn库中Kmeans类、超参数K值确定、特征归一化的讲解(图文解释)
【Python机器学习】Sklearn库中Kmeans类、超参数K值确定、特征归一化的讲解(图文解释)
436 0
|
机器学习/深度学习 自然语言处理 算法
使用PyTorch构建神经网络(详细步骤讲解+注释版) 03 模型评价与准确率提升
使用PyTorch构建神经网络(详细步骤讲解+注释版) 02-数据读取与训练 本文的使用的部分类方法为前述文章定义所得,如果希望运行完整代码建议同时查看上一篇文章或文末留言发你完整代码。
使用PyTorch构建神经网络(详细步骤讲解+注释版) 03 模型评价与准确率提升
|
机器学习/深度学习 数据可视化 数据挖掘
使用PyTorch构建神经网络(详细步骤讲解+注释版) 02-数据读取与训练
熟悉基础数据分析的同学应该更习惯使用Pandas库对数据进行处理,此处为了加深对PyTorch的理解,我们尝试使用PyTorch读取数据。这里面用到的包是torch.utils.data.Dataset。 在下面的代码中,分别定义了len方法与getitem方法。这两个方法都是python的内置方法,但是对类并不适用。这里通过重写方法使类也可以调用,并且自定义了getitem方法的输出
使用PyTorch构建神经网络(详细步骤讲解+注释版) 02-数据读取与训练
|
数据可视化
xgboost和lightgbm可视化方式及可解释方式
xgboost和lightgbm可视化方式及可解释方式
205 0
|
机器学习/深度学习 PyTorch 测试技术
使用PyTorch构建神经网络(详细步骤讲解+注释版) 01-建立分类器类
神经网络中,一个非常经典的案例就是手写数据的识别,本文我们以手写数据识别为例进行讲解。用到的数据是MNIST数据集。MNIST数据集是一个常用的用于计算机视觉的测试数据集,包含了70,000张手写数字的图片,用于训练和测试模型识别手写数字的能力。MNIST数据集中的图片大小都是28x28像素,图片中的数字是黑白的,每张图片都有对应的标签,表示图片中的数字是什么。MNIST数据集是计算机视觉领域的“Hello World”级别的数据集,被广泛用于计算机视觉模型的训练和测试。