最新公告:

中华视窗是诚信为本,市场在变,我们的诚信永远不变...

中华视窗

咨询热线

400-123-4657

公司动态

当前位置: 首页 > 新闻动态 > 公司动态

杭州数据分析岗招聘信息分析——基于拉勾网

添加时间:2024-02-22

/

求职进入每个行业之前,对该行业进行充分的了解是必不可少的。而最简单高效且客观的了解方式,就是查阅招聘信息。近阶段我一直在向数据分析方向靠拢,刷招聘网站也成为了日常动作。可是,每次打开招聘网刷一下,看信息挺碎片化的。接触数据久了,忍不住想分析下杭州数据分析岗位的整体情况。

本次分析探讨的问题:

1.杭州数据分析岗位的薪酬情况?

2.杭州数据分析岗对学历要求是怎样的?

3.招聘方更青睐有多长工作经验的数据分析师?

4.杭州各个区对数据分析师的需求情况?

一、获取数据

推荐工具:八爪鱼。

八爪鱼真的是爬虫神器,操作简便,不到半个小时,就帮我爬完了拉勾网上杭州数据分析相关的200多条数据,关键是爬到的数据特别干净!如下图:

苏州知名企业招聘_苏州业务招聘信息_苏州行业动态分析公司招聘

导出的数据

哎,其实我一开始用R的rvest包爬的,但是!代码不断报错,调试了一个多小时,还是出bug了,扎心了……代码如下:

#加载相关包
install.packages("rvest")
library(rvest)
library(xml2)
library(stringr)
#写个循环,对固定网页结构重复抓取i
i <- 1:17 
for (i in 1:17){
lagouweb <- read_html(str_c("https://www.lagou.com/zhaopin/shangyeshujufenxi/",
                          i,"/?filterOption=3"))
#结合SelectorGadget插件,获取网页相关标签
#read_html() 读取html文档
#html_nodes() 查找标签
#html_text() 提取标签内的文本
#%>%是管道操作符,意思是把左边的操作结果作为参数传递给右边的命令
company<- html_nodes(lagouweb,".company_name a")%>%html_text() #公司名称
job <- html_nodes(lagouweb,"h3")%>%html_text() #岗位名称
salary <- html_nodes(lagouweb,".money")%>%html_text() #薪资水平
industry <- html_nodes(lagouweb,".industry")%>%html_text() #行业
feature <- html_nodes(lagouweb,".li_b_r")%>%html_text() #岗位特色
location <- html_nodes(lagouweb,"em")%>%html_text() #工作地点
edu_experience <- html_nodes(lagouweb,".p_bot .li_b_l")%>%html_text() #教育、工作经验
lable <- html_nodes(lagouweb,".list_item_bot span")%>%html_text() #其它标签
#输出数据
lagoudata <- data.frame(company,job,salary,industry,feature,
                        location,edu_experience,lable)}

结果提示是:

Error in data.frame(company, job, salary, industry, feature, location,  : 
  arguments imply differing number of rows: 15, 17, 43
另外,循环语句也出问题,只爬到1页数据。
网上各种搜帖,没找到参考的解决办法。只能后续再摸索看看了。

Tip:本项目涉及到数据已共享在百度云盘

链接:/s/Hrw 密码:ew7k

拉勾爬出的原始数据表为:拉勾网-数据分析招聘信息采集.csv

二、数据整理

数据清洗涉及到很多细节,均在EXCEL中进行,具体内容:

整理好的数据表为:.csv

三、数据分析与展示

项目数据不复杂,用EXCEL的数据透视表应该是最便捷的做法了,就用它了✔(嗯,已经凌晨1点多了,再折腾下去明早7点的上班闹钟都用不到了)。产出的图有点点一般,缺点高大上的气息~

1.杭州数据分析岗位的薪酬情况

苏州行业动态分析公司招聘_苏州业务招聘信息_苏州知名企业招聘

如果单纯考虑薪资数据,224条数据给出的薪资平均值为15.88K。但由于之前计算薪资数据是,本来取得就是薪资区间的均值,数据已经失真,所以,此时再用一个均值判断整个杭州地区的薪资水平显然是不太合理的。

分析“薪资与工作经验”、“薪资与学历”之间的关系,更具有探讨价值。

先看下薪资水平与工作经验的关系:

苏州行业动态分析公司招聘_苏州知名企业招聘_苏州业务招聘信息

上图的数据清晰的展现了不同工作经验下,薪资水平的变化。总体来看,工作经验越长,薪资水平越高。工作5-10年的薪资水平基本在25k左右。工作经验在一年以下的薪资水平在10k左右。从薪资变化幅度看,工作经验3年以上,薪资会出现大幅提升(1-3年是12.7,3-5是19.14,涨幅50%),而在3年以下的工作经验,薪资变化幅度不大(11.29-8-12.7)。

再来看看薪资水平与学历的关系:

苏州业务招聘信息_苏州行业动态分析公司招聘_苏州知名企业招聘

结论很正常,学历越高,薪资水平也越高。大专档的是11.02k,硕士档是18.75。

2.杭州数据分析岗对学历要求是怎样的

上面分析了学历与薪资的关系,这里再讨论下学历要求在招聘中是如何分布的。

苏州知名企业招聘_苏州行业动态分析公司招聘_苏州业务招聘信息

本科学历还是主流啊,不过考虑到岗位是数据分析,所以对硕士学历要求会少很多,如果是数据挖掘,那硕士比例会高很多吧~

3.招聘方更青睐有多长工作经验的数据分析师

苏州业务招聘信息_苏州行业动态分析公司招聘_苏州知名企业招聘

3-5年工作经验是最受招聘方青睐的,结合前文提到的3-5年工作经验涨薪幅度也大。所以,从现阶段看,3-5年经验的数据分析师炙手可热~

4.杭州各个区对数据分析师的需求情况

苏州知名企业招聘_苏州业务招聘信息_苏州行业动态分析公司招聘

表格一理,原来西湖区是数据分析的黄金区,81个岗位需求,远超第2名滨江区的49。这也和每个区的特色产业密切有关,西湖区和滨江区科技企业较多,对数据的需求也更多。而江干区的数据分析与电商行业更相关。这张图标很客观的告诉想要从事数据分析的同志们,优先拥抱西湖区、滨江区,中的几率更大哈!

四、小结

本文通过八爪鱼爬取拉勾网上杭州的数据分析岗位数据,并通过EXCEL对数据进行整理和分析,得出如下结论:

存在的不足:

>限于实际招聘情况,样本数据是200多条,样本数不算大,所以容易受极端值的影响;如果分析全国的数据,会更好的反映国内数据分析岗位的现状。

>取薪资区间上下限的平均值代表平均薪资,与实际行业数据肯定会存在一定误差。

>其它肯定还有,还望指正~

>rvest爬虫没成功,好遗憾,求点拨~

联系我们

电话:400-123-4657

传真:+86-123-4567

地址:浙江 温州市 温州大道欧江大厦26188号

邮箱:admin@nxdls.net

电话:400-123-4657 传真:+86-123-4567 地址:浙江 温州市 温州大道欧江大厦26188号
版权所有:Copyright © 2002-2024 中华视窗 版权所有 非商用版本 ICP备案编号:粤IP**********    网站地图