# 什么你还不知道招聘信息，小唐来教你——最新2021取拉勾网招聘信息（二）

## 一、准备我们的库

import pandas as pd
import re
import seaborn as sns
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import cv2
#这里是为了让我们的中文可以显示出来
font = r'C:\Windows\Fonts\simfang.ttf'
plt.rcParams['font.sans-serif'] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False

## 二、数据清洗

def ciyun():
for i in range(df.shape[0]):
gz = df.loc[i, '工资']#选择工资那一列
if re.search(r'.*k-.*k', gz):
a = eval(re.search('(.*)k-(.*)k', gz).group(1)) * 1000
b = eval(re.search('(.*)k-(.*)k', gz).group(2)) * 1000
num = (a + b) / 2#求平均值
try:
df.loc[i, '工资'] = int(num)/1000
except:
print("跳过")
df.loc[i, '工资'] =0
visualization(df)#将我们洗好的数据传到我们下一个制作图表里面

## 三、核密度图及词云制作

def visualization(df):
salarys=df['工资']
for i in salarys:
print(i)
mean = round(salarys.mean(), 1)#求我们的平均值
plt.figure(figsize=(8, 6), dpi=200)#确定下来我们的行列数
sns.distplot(salarys, hist=True, kde=True, kde_kws={"color": "r", "linewidth": 1.5, 'linestyle': '-'})#画核密度图
plt.axvline(mean, color='r', linestyle=":")#在中间值那里画一条红线
plt.text(mean, 0.05, '平均月薪: %.1f千' % (mean), color='k', horizontalalignment='center', fontsize=15)#在红线中间输出中间值是多少
plt.xlim(0, 35)
plt.xlabel('月薪（单位：千）')
plt.title('工程师行业的薪资分布')
plt.show()
a = df['需求']#这里可以更改，可以显示地区呀，需求呀的词云
text = []
n = 0
#统计词频
for i in a:
text.append(i)
n += 1
text = ",".join(str(i) for i in text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()

## 四、完整代码

import pandas as pd
import re
import seaborn as sns
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import cv2
font = r'C:\Windows\Fonts\simfang.ttf'
plt.rcParams['font.sans-serif'] = ["SimHei"]
plt.rcParams["axes.unicode_minus"] = False
def ciyun():
for i in range(df.shape[0]):
gz = df.loc[i, '工资']
if re.search(r'.*k-.*k', gz):
a = eval(re.search('(.*)k-(.*)k', gz).group(1)) * 1000
b = eval(re.search('(.*)k-(.*)k', gz).group(2)) * 1000
num = (a + b) / 2
try:
df.loc[i, '工资'] = int(num)/1000
except:
print("跳过")
df.loc[i, '工资'] =0
visualization(df)
def visualization(df):
salarys=df['工资']
for i in salarys:
print(i)
mean = round(salarys.mean(), 1)
plt.figure(figsize=(8, 6), dpi=200)
sns.distplot(salarys, hist=True, kde=True, kde_kws={"color": "r", "linewidth": 1.5, 'linestyle': '-'})
plt.axvline(mean, color='r', linestyle=":")
plt.text(mean, 0.05, '平均月薪: %.1f千' % (mean), color='k', horizontalalignment='center', fontsize=15)
plt.xlim(0, 35)
plt.xlabel('月薪（单位：千）')
plt.title('工程师行业的薪资分布')
plt.show()
a = df['需求']
text = []
n = 0
for i in a:
text.append(i)
n += 1
text = ",".join(str(i) for i in text)
wordcloud = WordCloud(font_path=font, background_color="white").generate(text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
ciyun()

## 五、扩展

|
1月前
|
JSON 移动开发 JavaScript

37 6
|
1月前
|

23 2
|
4天前
|

9 0
|
1月前
|

23 2
|
1月前
|

23 1
|
1月前
|

【2月更文挑战第7天】本文介绍2024届秋招中，中国长城资产管理股份有限公司的信息技术岗岗位一面的面试基本情况、提问问题等~
45 8
|
7月前
|

46 0
|

89 0
|

Python爬虫系列2-采集2022年拉钩网最新的IT岗位招聘数据
2022年转眼已过半，再过半年即将迎来2023年，我坚信疫情早晚会过去，2023年相信会是一个互联网全新的时代：物联网时代，古语云：十年磨一剑，古时候烽火传递、飞鸽传书，交流信息很不方便。古人就幻想着有千里眼和顺风耳。能看到千里之外的地方和听到很远地方的声音。从2000年至2010年这十年，古人的愿望变成了现实；我们见证了全智能手机的发展历程；以及2010年至2020年的移动互联网从早期的2G网络过渡至3G到现在的4G网络甚至到目前已经慢慢普及但尚未成熟的5G网络的发展历程；我们也坚信未来的万物互联距离现如今的我们也并不是一件很遥远的事情。 如果本文对你有些帮助-还请点赞👍关注！
370 1
|

【招聘信息】

907 0