Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略

简介: Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略

RentListingInquries比赛简介


竞赛官网: https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/overview


       RentListingInquries比赛的描述。找到一个完美的地方打电话给你的新家应该比浏览无穷无尽的清单。RentHop通过使用数据对租赁清单的质量进行排序,使公寓搜索更加智能。但是,尽管寻找完美的公寓已经够困难的了,但通过编程来组织和理解所有可用的房地产数据就更难了。二西格玛和二西格玛风投的投资组合公司RentHop,邀请Kagglers在这场独特的招聘竞争中,释放他们的创意引擎,发掘商业价值。

     Two Sigma邀请您在本次招聘竞赛中发挥您的才能。Kagglers将根据列表的创建日期和其他特性预测新列表收到的查询数量。这样做将有助于RentHop更好地处理欺诈控制,识别潜在的上市质量问题,并让业主和代理商更好地了解租户的需求和偏好。

      Two Sigma一直处于将技术和数据科学应用于财务预测的前沿。尽管他们在金融领域的大数据、人工智能和机器学习方面取得的开创性进展,一直在推动该行业向前发展,就像所有其他科学进步一样,他们也受到不断进步的驱动。这一挑战为竞争对手提供了一个先睹为奇的机会,使他们得以在金融领域之外抢先了解二西格玛的数据科学工作。


      这是Kaggle2017年举办的Two Sigma Connect: Rental Listing Inquiries竞赛。在这个竞赛中,你将根据列表内容,如文字描述、照片、卧室数量、价格等,来预测一个公寓租赁清单的受欢迎程度。数据来自renthop.com,一个公寓上市网站。这些公寓位于纽约市。目标变量interest_level由清单在网站上运行期间的查询次数定义。



1、数据集介绍




(1)、File descriptions

train.json - the training set

test.json - the test set

sample_submission.csv - a sample submission file in the correct format

images_sample.zip - listing images organized by listing_id (a sample of 100 listings)

Kaggle-renthop.7z - (optional) listing images organized by listing_id. Total size: 78.5GB compressed. Distributed by BitTorrent (Kaggle-renthop.torrent).


(2)、Data fields


bathrooms: number of bathrooms

bedrooms: number of bathrooms

building_id

created

description

display_address

features: a list of features about this apartment

latitude

listing_id

longitude

manager_id

photos: a list of photo links. You are welcome to download the pictures yourselves from renthop's site, but they are the same as imgs.zip.

price: in USD

street_address

interest_level: this is the target variable. It has 3 categories: 'high', 'medium', 'low'

       根据公寓的listing 内容,预测纽约市某公寓租赁listing的受欢迎程度。

标签: interest_level,该listing被咨询的次数。


(1)、有三个取值:: 'high', 'medium', 'low'。

(2)、是一个多类分类任务。

Listing内容:


bathrooms、bedrooms:浴室数目、卧室的数目

longitude、latitude:地理位置有关

display_address、street_address:地址有关

building_id、listing_id、manager_id

Created:创建日期

Description:更多描述信息

features: 公寓的一些特征描述

photos: a list of photo links

price:价格


2、比赛排行榜


image.png




RentListingInquries数据集下载


如有需要,可留言索取






相关文章
|
JavaScript 搜索推荐 前端开发
Vue的SSR 是什么,优缺点分析
Vue的服务器端渲染(SSR)是一种将Vue组件在服务器上执行,并生成完整的HTML页面的技术,这个HTML页面随后被发送至客户端的浏览器进行展示。
|
2月前
|
Java API 数据库
2025 年最新 Java 实操学习路线,从入门到高级应用详细指南
2025年Java最新实操学习路线,涵盖从环境搭建到微服务、容器化部署的全流程实战内容,助你掌握Java 21核心特性、Spring Boot 3.2开发、云原生与微服务架构,提升企业级项目开发能力,适合从入门到高级应用的学习需求。
602 0
|
8月前
|
人工智能 监控 数据可视化
Manus再遭复刻!开源多智能体协作工具,实时查看每个AI员工的"脑回路"
LangManus 是一个基于分层多智能体系统的 AI 自动化框架,支持多种语言模型和工具集成,能够高效完成复杂任务,适用于人力资源、房产决策、旅行规划等多个场景。
948 0
|
8月前
|
文字识别 BI API
3.4K star!全能PDF处理神器开源!文档转换/OCR识别一键搞定
PDF-Guru 是一款开箱即用的全能型PDF处理工具,支持跨平台文档转换、智能OCR识别、多格式解析等核心功能。项目采用模块化架构设计,提供简洁的Web界面和API接口,开发者可快速集成到现有系统中。
665 1
EMQ
|
JSON Linux 网络性能优化
MQTT 5.0 报文解析 02:PUBLISH 与 PUBACK
本文将介绍在 MQTT 中用于传递应用消息的 PUBLISH 报文以及它的响应报文。不管是客户端向服务端发布消息,还是服务端向订阅端转发消息,都需要使用 PUBLISH 报文。决定消息流向的主题、消息的实际内容和 QoS 等级,都包含在 PUBLISH 报文中。
EMQ
963 88
MQTT 5.0 报文解析 02:PUBLISH 与 PUBACK
|
Web App开发 网络协议 Linux
linux命令总结(centos):shell常用命令汇总,平时用不到,用到就懵逼忘了,于是专门写了这篇论文,【便持续更新】
这篇文章是关于Linux命令的总结,涵盖了从基础操作到网络配置等多个方面的命令及其使用方法。
312 1
linux命令总结(centos):shell常用命令汇总,平时用不到,用到就懵逼忘了,于是专门写了这篇论文,【便持续更新】
|
存储 数据挖掘 API
购物平台数据抓取实战指南:从API到深度分析
本指南介绍如何通过API接口抓取淘宝、京东、拼多多等电商平台的数据,涵盖API选择、注册配置、数据抓取与处理、深度分析等内容,帮助企业和开发者挖掘数据价值,支持市场分析和决策制定。
|
消息中间件 关系型数据库 MySQL
SpringBoot-Kafka(生产者事务、手动提交offset、定时消费、消息转发、过滤消息内容、自定义分区器、提高吞吐量)
SpringBoot-Kafka(生产者事务、手动提交offset、定时消费、消息转发、过滤消息内容、自定义分区器、提高吞吐量)
SpringBoot-Kafka(生产者事务、手动提交offset、定时消费、消息转发、过滤消息内容、自定义分区器、提高吞吐量)
|
SQL Java 关系型数据库
SpringBoot整合MybatisPlus基本的增删改查,保姆级教程
SpringBoot整合MybatisPlus基本的增删改查,保姆级教程
721 0
|
存储 自然语言处理 Go