ML之FE:利用FE特征工程(单个特征及其与标签关系的可视化)对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测(四)

简介: ML之FE:利用FE特征工程(单个特征及其与标签关系的可视化)对RentListingInquries(Kaggle竞赛)数据集实现房屋感兴趣程度的多分类预测(三)

2.7、词云图可视化:

【display_address】、【street_address】、【features】image.png

设计思路

image.png

image.png


核心代码

from wordcloud import WordCloud

text = ''

text_da = ''

text_street = ''

#text_desc = ''

for ind, row in train.iterrows():

   for feature in row['features']:

       text = " ".join([text, "_".join(feature.strip().split(" "))])

   text_da = " ".join([text_da,"_".join(row['display_address'].strip().split(" "))])

   text_street = " ".join([text_street,"_".join(row['street_address'].strip().split(" "))])

   #text_desc = " ".join([text_desc, row['description']])

text = text.strip()

text_da = text_da.strip()

text_street = text_street.strip()

#text_desc = text_desc.strip()

plt.figure(figsize=(12,6))

wordcloud = WordCloud(background_color='white', width=600, height=300, max_font_size=50, max_words=40).generate(text)

wordcloud.recolor(random_state=0)

plt.imshow(wordcloud)

plt.title("features: Wordcloud for features", fontsize=30)

plt.axis("off")

plt.show()

# wordcloud for display address

plt.figure()

wordcloud = WordCloud(background_color='white', width=600, height=300, max_font_size=50, max_words=40).generate(text_da)

wordcloud.recolor(random_state=0)

plt.imshow(wordcloud)

plt.title("display_address: Wordcloud for Display Address", fontsize=30)

plt.axis("off")

plt.show()

# wordcloud for street address

plt.figure()

wordcloud = WordCloud(background_color='white', width=600, height=300, max_font_size=50, max_words=40).generate(text_street)

wordcloud.recolor(random_state=0)

plt.imshow(wordcloud)

plt.title("street_address: Wordcloud for Street Address", fontsize=30)

plt.axis("off")

plt.show()



相关文章
|
7月前
|
算法 数据挖掘
【数据挖掘】朴素贝叶斯分类讲解及对iris数据集分类实战(超详细 附源码)
【数据挖掘】朴素贝叶斯分类讲解及对iris数据集分类实战(超详细 附源码)
330 0
|
机器学习/深度学习
【机器学习】多标签分类的评价指标与代码实现
【机器学习】多标签分类的评价指标与代码实现
736 1
【机器学习】多标签分类的评价指标与代码实现
|
机器学习/深度学习 自然语言处理
(路透社数据集)新闻分类:多分类问题实战
(路透社数据集)新闻分类:多分类问题实战
|
机器学习/深度学习 存储 算法
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(二)
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(二)
220 0
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(二)
|
机器学习/深度学习 算法 计算机视觉
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
282 0
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
|
机器学习/深度学习 算法 测试技术
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(二)
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(二)
270 0
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(二)
|
机器学习/深度学习 数据采集 算法
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(一)
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(一)
579 0
不平衡数据集分类实战:成人收入数据集分类模型训练和评估(一)
|
机器学习/深度学习
【阿旭机器学习实战】【27】贝叶斯模型:新闻分类实战----CounterVecorizer与TfidVectorizer构建特征向量对比
【阿旭机器学习实战】【27】贝叶斯模型:新闻分类实战----CounterVecorizer与TfidVectorizer构建特征向量对比
|
算法 数据挖掘 API
AutoML | AutoSklearn的基本分类、回归、多输出回归和多标签分类数据集的使用示例
AutoML | AutoSklearn的基本分类、回归、多输出回归和多标签分类数据集的使用示例
213 0
AutoML | AutoSklearn的基本分类、回归、多输出回归和多标签分类数据集的使用示例
|
机器学习/深度学习 算法 Python
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
598 0
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类

热门文章

最新文章