ML之FE:利用FE特征工程(单个特征及其与标签关系的可视化)对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测(三)

简介: ML之FE:利用FE特征工程(单个特征及其与标签关系的可视化)对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测

2.2.8、【manager_id】列


image.png


2.3、查看日期型特征:

【created】、【hour】、【month】

image.png



2.4、查看图片类型特征:【photos】


image.png


2.5、查看~~类型特征:【features】


image.png


2.6、查看单词计数类型特征

2.6.1、【description】


image.png


T1.0、不采用去掉奇异点法


image.png


T1.1、利用np.percentile()方法,ulimit(99),只保留某些分位数内的点去掉奇异点


image.png




2.6.2、【num_description_words】


image.png


T1.0、不采用去掉奇异点法

image.png



T1.1、利用np.percentile()方法,ulimit(99),只保留某些分位数内的点去掉奇异点

image.png



T1.2、直接定量限制法,ulimit(500)




 image.png


相关文章
|
机器学习/深度学习 数据采集 算法
KMeans+DBSCAN密度聚类+层次聚类的使用(附案例实战)
KMeans+DBSCAN密度聚类+层次聚类的使用(附案例实战)
1494 0
|
Web App开发 Python
直接保存“DataFrame表格”到本地,这个“骚操作”90%以上的人不知道!
直接保存“DataFrame表格”到本地,这个“骚操作”90%以上的人不知道!
直接保存“DataFrame表格”到本地,这个“骚操作”90%以上的人不知道!
|
消息中间件 存储 NoSQL
一文读懂Kafka Connect核心概念
Kafka Connect 是一种用于在 Apache Kafka 和其他系统之间可扩展且可靠地流式传输数据的工具。 它使快速定义将大量数据移入和移出 Kafka 的连接器变得简单。 Kafka Connect 可以摄取整个数据库或从所有应用程序服务器收集指标到 Kafka 主题中,使数据可用于低延迟的流处理。 导出作业可以将数据从 Kafka 主题传送到二级存储和查询系统或批处理系统进行离线分析。
|
JavaScript jenkins Shell
Jenkins安装、使用nodejs
Jenkins安装、使用nodejs
1274 0
|
SQL 数据挖掘 数据库
HiveSQL分位数函数percentile()使用详解+实例代码
HiveSQL分位数函数percentile()使用详解+实例代码
6029 0
HiveSQL分位数函数percentile()使用详解+实例代码
|
移动开发 开发工具 双11
什么是Deeplink?以及Deeplink的原理
Deeplink,又叫深度链接技术,是指在App/短信/广告里点击链接,用户点击后, 能直接跳转到目标App具体位置的技术,深度链接打破了网站与App间的壁垒,成为实现网站与App相互跳转的桥梁。开发者不仅可以通过Deeplink实现网站到App互相跳转,也可以实现从多个平台(QQ、微信、微博、Twitter、Facebook、短信、各大浏览器等)到App内指定页的跳转。
什么是Deeplink?以及Deeplink的原理
|
11月前
|
机器学习/深度学习 自然语言处理 人机交互
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
在大型语言模型(LLM)的预训练中,尽管模型已接触数万亿个标记,但仍可能生成不符合预期的响应。为解决这一问题,研究者提出了RLHF、DPO和KTO等对齐技术。然而,这些技术各有局限。为此,论文《UNA: Unifying Alignments of RLHF/PPO, DPO and KTO by a Generalized Implicit Reward Function》提出了一种新的统一对齐方法UNA。UNA通过引入广义隐式奖励函数,成功将RLHF/PPO、DPO和KTO统一起来,简化了训练过程,提高了模型的鲁棒性和性能。
316 15

热门文章

最新文章