ML之FE:利用FE特征工程(单个特征及其与标签关系的可视化)对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测(四)

简介: ML之FE:利用FE特征工程(单个特征及其与标签关系的可视化)对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测(三)

2.7、词云图可视化:

【display_address】、【street_address】、【features】image.png

设计思路

image.png

image.png


核心代码

from wordcloud import WordCloud

text = ''

text_da = ''

text_street = ''

#text_desc = ''

for ind, row in train.iterrows():

   for feature in row['features']:

       text = " ".join([text, "_".join(feature.strip().split(" "))])

   text_da = " ".join([text_da,"_".join(row['display_address'].strip().split(" "))])

   text_street = " ".join([text_street,"_".join(row['street_address'].strip().split(" "))])

   #text_desc = " ".join([text_desc, row['description']])

text = text.strip()

text_da = text_da.strip()

text_street = text_street.strip()

#text_desc = text_desc.strip()

plt.figure(figsize=(12,6))

wordcloud = WordCloud(background_color='white', width=600, height=300, max_font_size=50, max_words=40).generate(text)

wordcloud.recolor(random_state=0)

plt.imshow(wordcloud)

plt.title("features: Wordcloud for features", fontsize=30)

plt.axis("off")

plt.show()

# wordcloud for display address

plt.figure()

wordcloud = WordCloud(background_color='white', width=600, height=300, max_font_size=50, max_words=40).generate(text_da)

wordcloud.recolor(random_state=0)

plt.imshow(wordcloud)

plt.title("display_address: Wordcloud for Display Address", fontsize=30)

plt.axis("off")

plt.show()

# wordcloud for street address

plt.figure()

wordcloud = WordCloud(background_color='white', width=600, height=300, max_font_size=50, max_words=40).generate(text_street)

wordcloud.recolor(random_state=0)

plt.imshow(wordcloud)

plt.title("street_address: Wordcloud for Street Address", fontsize=30)

plt.axis("off")

plt.show()



相关文章
|
5月前
|
机器学习/深度学习 数据可视化
R语言用灰色模型 GM (1,1)、神经网络预测房价数据和可视化
R语言用灰色模型 GM (1,1)、神经网络预测房价数据和可视化
|
机器学习/深度学习 算法
【机器学习】分类模型评价指标(混淆矩阵、ROC)(已修改,放心看)
【机器学习】分类模型评价指标(混淆矩阵、ROC)(已修改,放心看)
181 0
|
机器学习/深度学习 算法 计算机视觉
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
244 0
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
|
机器学习/深度学习 存储 算法
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(二)
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(二)
190 0
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(二)
|
机器学习/深度学习 数据采集 算法
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(一)
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(一)
528 0
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(一)
|
机器学习/深度学习 算法 测试技术
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(二)
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(二)
241 0
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(二)
|
机器学习/深度学习 算法 计算机视觉
【阿旭机器学习实战】【23】特征降维实战---人脸识别降维建模,并选出最有模型进行未知图片预测
【阿旭机器学习实战】【23】特征降维实战---人脸识别降维建模,并选出最有模型进行未知图片预测
|
机器学习/深度学习 算法 Python
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
532 0
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
|
数据可视化
ML之shap:基于adult人口普查收入二分类预测数据集(预测年收入是否超过50k)利用shap决策图结合LightGBM模型实现异常值检测案例之详细攻略
ML之shap:基于adult人口普查收入二分类预测数据集(预测年收入是否超过50k)利用shap决策图结合LightGBM模型实现异常值检测案例之详细攻略
ML之shap:基于adult人口普查收入二分类预测数据集(预测年收入是否超过50k)利用shap决策图结合LightGBM模型实现异常值检测案例之详细攻略
|
数据可视化
ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘
ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘
ML之FE:对人类性别相关属性数据集进行数据特征分布可视化分析与挖掘
下一篇
无影云桌面