开发者学堂课程【场景实践-阿里云 Quick BI 在房源的画像分析上的应用:房源画像模型介绍】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/525/detail/7082
房源画像模型介绍
内容介绍:
一、背景
二、房屋信息-基本信息
三、房屋信息-配套服务及资源
四、房源信息-委托信息
五、房源信息-业主、经纪人相关事件
六、房源信息-模型
七、房源信息-模型关系
本节介绍与实验有关的房屋房源的相关业务及数据模型介绍
一、背景
ihouse 是一家二手房交易中介公司,公司数据库中沉淀大量二手房相关房屋信息、业主委托、经纪人运营数据,但数据分散在不同的数据库中,不方便产品、运营、分析、算法人员使用。公司希望数据仓库团队能够将散落在各个系统、各个业务环节(房屋处于什么状态中:处于销售过程还是办理证照过程中还是处于看房阶段)的房屋、房源及相关经纪人运营数据整合起来,形成完善房源画像信息,以支持产品迭代、提高运营效率、方便数据分析并为算法人员提供完备特征数据,进行深度分析探索。在画像基础上,希望数据仓库团队提供常用维度上的分析报表,满足日常运营报表需求。
以上就是实验目标:1.整合数据 2.构建一个画像系统 3.利用画像系统出日常运维报表
二、房屋信息-基本信息
位置信息:省、市、区 楼盘(小区) 楼栋 单元 楼层 门牌……
户型、布局、装修(房屋本身属性信息):×室Y厅Z卫及具体布局 建筑面积、室内面积 房屋朝向 户型结构……
其它杂项(房屋相关的辅助信息):供暖方式、供水方式、是否有电梯、建筑类型、建筑结构、梯户比例……
有三大类信息,每一大类又包括不同的细项
三、房屋信息-配套服务及资源
房产行业中非常重要的一部分。如果有购房经历或者租房经历一般都会涉及到这些辅助性资源。例如买房希望有靠谱的开发商、物业,小区旁有好的学校、医院,同样有好的交通、商圈和社区。
开发商、物业:·名称·品牌·资质·集团信息·服务电话……
学校、医院:·名称·分级·性质·地址·电话·占地面积·师资、医资力量·硬件水平·收费情况……
交通、商圈、社区:·地铁站·地铁线·直线距离、步行距离·社区名称·社区类型、级别……
以上是几个常见的有关房屋考虑的非常关键的信息。
四、房源信息-委托信息
业主信息 :业主姓名、微信、手机号、宅电、联系人姓名、联系人手机号、业主与联系人关系
交易信息 :挂牌价格、房源信息、房屋用途、是否限购、是否具有产权、是否唯一房产、房本登记日期、户口情况等
委托信息 :委托来源、录入人姓名、维护人姓名、签约人姓名等
房源现状:房源状态、是否租赁、租赁方式、租赁付款方式、租赁配套设施、看房时间等
要交易二手房就会有交易信息,交易房就会有交易相关的信息。委托信息对于房子也非常关键,对于购房者也为关键信息,也是影响交易完成的重要信息。
五、房源信息-业主、经纪人相关事件
房源委托证件提供、业主自荐、房源调价、房源实勘、房源钥匙管理、房源带看、经纪人房评、房源浏览
业主有无犯罪记录、有无欠债、诚信度较低等,经纪人信誉如何等相关事件。房屋被看多少次,从外其它渠道了解多少等就是房源其它的业主、经纪人相关事件信息即事件类处理。
六、房源信息-模型
房屋信息及模型
房屋信息及模型(房子本身相关信息):房屋信息、楼栋信息、单元信息、楼层信息、楼盘信息、户型信息、开发商信息、物业信息、学校及学区信息、商圈信息、社区信息、地铁信息、城区/城市/省份信息
房源信息及模型:房源基础信息、房源相关证件信息、业主自荐信息、房源调价信息、房源实堪信息、房源钥匙信息、房源带看信息、房源浏览信息、经济人房源评论信息
以上就是模型的物理化设计过程。
七、房源信息-模型关系
房屋的基础信息:开发商、楼盘关系、物业关系、社区关系、学校关系、交通状况,房源本身信息以及其它辅助信息。以上就是整个有关房源的模型关系,也是进行画像前对数据进行了解分析过程。