Human Resources
人力资源  |  MODERN  BUSINESS鸡泽教育网
现代商业
67
国内主流编程职业结构研究
——基于招聘网站信息的挖掘分析
夏鑫雨 刘超达 李 蕊 刘鸣涛
临沂大学信息科学与工程学院 山东临沂 276000
一、引言
随着大数据时代的到来,网络发布招聘信息成为了一种较为流行的方式,而大量的招聘信息却反映了当今社会对所需人才的要求,如职位、编程语言等,同时,有效的招聘信息更是为各大高校在培养高层次人才时起到了促进的作用,让学校在安排课程时,能够清楚了解到当今社会所需的是什么样的人才,并
为高校学生适当的调整学习方向以及使学生自己能够更直观的了解社会技术发展方向,及时的调整自己的学习方向,紧跟社会发展方向。对此,本次对于WEB招聘信息的挖掘及分析具有了实际的价值作用。由于招聘信息的信息量繁杂冗余,所以本次的研究与分析采用网络爬虫技术成为了重要途径。本文基于数据挖掘技术,对招聘信息进行研究与分析,为高校和学生提供决策应用的信息。
二、研究方法
本文利用网络爬虫技术对51job招聘网站发布的招聘信息数据进行采集,在对非结构化文本数据进行筛选、去重、去空等预处理操作后,对预处理后的招聘数据使用Tableau工具进行数据可视化分析,挖掘当今社会所需人才结构,深入分析人才需求和国内主流编程语言职业候选人背景分析。
三、数据爬取与存储
(一)Python爬虫
Python,JAVA和PHP等语言均可编写网络爬虫,但通过调研比较,最终选择Python语言来具体实现网络爬虫功能。因为在Python中有Scrapy成熟的网络爬虫框架,并且其语法简洁,可引用的库较多。Python语言应用于网络爬虫可使用其自带的urllib库,第三方requests库和Scrapy网络爬虫框架,它们也各有利弊,如urllib库不能直接处理Unicode对象,其需要先解码为UTF-8才可获取网页内容,而req
uests库在直接使用时不能异步调用,速度慢,但其可自动解码。对于Scrapy框架,当后期需要爬取大量招聘数据时,便可以通过其异步性,提高爬取效率。目前,本文前期已经通过引用requests库对网页源代码进行了爬取,并利用BeautifulSoup 库对源代码解析获取所需特定内容,从而实现了对无反爬虫机制网站信息的爬取。通过学习研究,本文的最终数据通过Scrapy-redis 分布式网络爬虫获得。而对于网络爬虫中应对反爬虫机制也将是我们将要开启的下一个征程。
厦门教师招聘公告2023(二)数据采集与存储
本次所有分析的数据均来自于51job招聘平台,其发布的职位
信息具有一定的代表性。此次本文结论的依据也是基于此平台的招聘信息而所分析获得。本文将基于Scrapy-redis框架的网络爬虫原理,对51job平台招聘信息进行采集,此举也正是为了实现异步的分布式爬虫,对请求和数据的高频读取效率非常高。下图则为Scrapy-redis框架结构图。如图1。
图1 Scrapy-redis框架结构图
Scrapy-redis框架是基于Scrapy框架进一步的“升级改造”,其目的就是为了能够实现分布式的网络爬虫,提高爬虫的爬行效率。分布式爬虫则是我们有一个Master端和若干个Slaver端(如图2),Master端则只负责Request去重、任务分布和数据存储,而Slaver端则需要负责执行爬虫程序爬取数据,并将
爬取过程中新的Requests提交到Master端的Redis数据库中。在图1中,Slaver端先通过Spiders调用Scheduler队列,若干个Slaver共用同一个Redis 数据库获得一个新的Requests请求,将请求到的Response返回到Spiders,产生一个item和一个requests,产生的新的item被传递给Item Pipeline等待进一步的处理和存取,而requests则继续在进入Scheduler队列,持续执行以上过程直至没有新的requests。
图2 分布式爬虫结构
摘要:当今大学课程所学内容与社会所需人才要求依旧存在脱节现象,大部分大学生对自己专业或感兴趣的职业在社会中所需要的技能需求所知甚少。本文对招聘网站的数据进行简要分析,为高校调整课程和学生对将来就业的了解提供了参考。即通过对51job招聘平台招聘信息的挖掘,对国内主流编程的需求及现状进行分析与研究,运用Tableau软件对数据进行更直观的可视化,对可视化结果进行研究与分析,得出有参考价值的结果。
关键词:WEB招聘信息;数据挖掘;可视化
中图分类号:F49;F272.92  文献识别码:A  文章编号:1673-5889(2019)30-0067-03
Human Resources
|  人力资源
MODERN  BUSINESS
现代商业68(三)数据预处理
在进行对特定数据挖掘之前,需要对采集来文档进行预处理。由于网页上由大量的“噪音”信息,比如图片、评论、新闻信息等等,所以对采集来的网页首先应该进行净化,去除这些“噪音”,才能为后面的数据分析提供精准而可靠的数据。在文档中大量而又冗余的数据,计算机很难精准处理其语义,若不先将我们所需的特定数据抽取出来,那么得到的分析结果的准确性就会大打折扣。所以,我们必须对爬取到的文档进行预处理,抽取出我们想要的特征数据,并将特征数据用结构化的形式保存,作为网页文档与实验结论的中间量。
东奥会计在线四、数据可视化与分析
本文通过使用可视化软件Tableau,分析存储在MongoDB数据库从2018年12月开始到2019年3月截至的收集的51job招聘网站的数据,对其进行可视化后,对形成的各种成像图再次进行具体分析得出预测结论。其中对国内主流编程语言职业候选人背景分析的数据规模为78万条,国内Python编程职业候选人背景分析数据规模为45.5万条。我们先后对编程语言需求量、各地区对语言的需求、Python编程所需人才学历、相同学历背景下工作经验的需求进行了分析比对。
(一)国内主流编程语言职业候选人背景分析
本文爬取了国内5种主流的编程语言。通过对存储信息的可视化分析得出结果,如图3所示。各编程语言排名如下:JAVA占比最高、Python位列第二,C++、C#、PHP位列其后。不难看出JAVA几乎占据了整个编程行业的半壁江山,其地位是无法撼动的;而Python作为编程语言的新起之秀却占到了记录数总计的第二位,紧随JAVA之后,发展前景极为可观;C#和PHP虽在总记录数中比重较低,却仍有需求。
免试认定教师资格证的条件
图3 编程语言需求比较
图4  编程语言需求区域分析
图4为各地区对各语言的需求分析,通过图4可知上海、深圳、广州、北京等经济较为发达的一线城市对编程人员的需求较大,所需语言种类也较为丰富,其中上海的需求量最大。在排名靠前的城市中,对编程语言的招聘需求量排名分别为JAVA、Python、C ++、C #、P H P 。符合图3中对国内各编程语言的需求比较结果。而在二线城市中,大部分都在使用JAVA编程,使用Python、C++、C#、PHP的岗位需求很少甚至没有。
(二)国内Python编程职业候选人背景分析
本文从学历和工作经验两方面对国内Python编程职业候选人
背景进行了简要分析:将存储信息数据的学历分布划分为硕士、本科、大专、中专以及None(招聘网站未注明对学历要求)五类。主要分布情况见图5。
图5
由上述数据分析得出,目前Python编程职业最低学历为中专。本科和无学历要求占比最高,分别为57.93%、18.0%。不难看出,本科学历占据了一半以上。说明目前社会中信息分析人员的学历背景主要为本科,而高学历背景的人员如硕士学历及以上学历的需求则相对较少。同时结合有无工作经验的指标(见图6),在学历背景相同的情况下,招聘单位更倾向于有工作经验的候选人。
图6 学历/工作经验要求情况
P y t h o n 相关的职位有3.5万个,一线城市占总职位量的86.25%,说明Python的职位需求主要集中在发达的一线城市;二线城市中杭州以总职位数量的6.58%占据首位,这也从侧面反映了杭州这几年互联网企业的快速发展。因此,对于未来想从事编程行业的人才来讲,坚守一线城市或者去有发展前景的二线城市相对来说是较为明智的选择。此外,学历分布主要集中在本科学历,其次为大专及以下学历,硕士及博士总共占比6.92%,这说明编程行业对人才的学历要求不是很高,更加强调求职者所掌握的技能。
五、人才需求趋势预测
图7 Python职位需求变化
Human Resources
农村信用社什么时候考试人力资源  |  MODERN  BUSINESS
现代商业
69
企业招聘网站特征、企业吸引力与应聘者求职意向的关系研究
廖纮亿1  秦小珺2
1.上海师范大学哲学与法政学院  上海 200234
2.厦门大学嘉庚学院管理学院 福建漳州 363105
人力资源是企业资源中的重要组成部分,优秀的人力资源是企业竞相争夺的对象,如何吸引优秀人才对于现今企业至关重要。近年来随着网络技术的快速发展,越来越多的企业选择使用网络招聘,网络招聘在招聘渠道的舞台上发挥着重要作用。网络招聘(Web-based recruiting)又称在线招聘,是指利用互联网技术进行的招聘活动,包括信息的发布、简历的搜集整理、电子面试以及在线测评等,具有低成本、无地域限制、范围广信息量大等优点(钱亮,2008)。根据《财富》杂志统计,全球500强企业中有超过八成的企业使用网络招聘来招聘新员工。网络招聘不仅能为企业带来更低成本和更高效率的招聘服务,也是企业吸引优秀人才的关键利器。尽管网络招聘在企业中已得到广泛应用,然而我们对于如何有效设计招聘网站,从而最大程度地吸引应聘者关注和投递简历等问题还是缺乏了解。对于这个问题的深入研究有助于拓展我们对网络招聘活动的认识,也有助于加强企业招聘工作的实践和管理。
回顾过去文献,国内外学者对于招聘网站特征与求职意向之间的关系有着较多的研究,但从“企业吸引力”来考察招聘网站特征对应聘者求职态度和行为的影响研究较少。因此,本研究基于信号理论,从招聘网站特征出发,在过去研究的基础上,构建了招聘网站特征对应聘者求职意向的影响机制模型,除了与以往研究相似,探测招聘网站的美观性和易用性外,本研究还加入了“信息完整性”维度,使招聘网站的特征要素更为完善,更清楚地理解招聘网站特征对企业吸引力的影响作用。此外,招聘网站特征究竟是“如何”影响应聘者的求职意向?过去已有一些研究发现招聘网站特征对应聘者求职态度和行为
的影响会通过一些中介变量来传递。例如,Chen等(2012)调查了招聘网站内容和网站风格对应聘者吸引力的影响,以及个人与组织匹配和个人与工作匹配在其中的中介作用。Allen 等(2007)发现招聘网站上的工作信息会直接影响应聘者的求职意向,而组织信息则会间接通过应聘者态度影响其求职意向。陈帅、叶洋忆(2016)的研究表明,招聘网站的内容和视觉会间接通过应聘者对组织的信任感影响其求职意向。然而,这些研究对于招聘网站特征作用于应聘者求职意向的中介机制的认识还远远不足,尤其缺乏对应聘者如何看待招聘网站所传递信息以及相应心理过程的认识。因此,本研究将论证企业吸引力在招聘网站特征和求职意向之间的中介作用,以弥补过去研究在这方面的不足。再者,本研究通过探讨招聘网站的特征、企业吸引力和应聘者求职意向之间的关系,有利于企业改善招聘网站设计,提升网络招聘的有效性,从而达到吸引优秀人才的目标,同时还能增强我们对于这种招聘活动的认识,有助于企业招聘管理工作的实践。
综上所述,本研究的研究目的是探讨招聘网站特征对求职意向的影响机制,同时分析企业吸引力在这之间的中介作用,冀望
摘要:随着网络普及,网络招聘及应聘已成为一种非常普遍且广受欢迎的渠道。本研究基于信号理论,针对105名高年级在校本科生进行问卷调查。研究结果表明:招聘网站特征对企业吸引力有正向影响;企业吸引力对求职意向有正向影响;企业吸引力在招聘网站特征和求职意向的关系中起到了中介作用。最后,讨论结果意涵、不足及展望。
湖北考试院网关键词:网络招聘;招聘网站特征;企业吸引力;求职意向
中图分类号:F272.92   文献识别码:A  文章编号:1673-5889(2019)30-0069-03
从图7可以看出,从2018年12月到2019年3月的4个月里,与Python相关的职位需求一直处于平稳态势。由于采集的数据时间跨度较短,且缺少对应的行业景气度的内生因素分析,尚无法深入分析导致短期内职位需求变化的内在控制因素,对该领域人才需求的趋势预测尚需开展数年(如5年~10年)的统计与分析。
六、结束语
本文基于Python语言的Scrapy框架设计网络爬虫程序,经过预处理获取招聘的职位信息,后通过可视化软件Tableau进行可视化分析,分析了当前主流编程语言的需求量以及各城市对编程语言的需求对比,通过对国内Python人才招聘需求的学历分布以及相同学历之间工作经验的具体比较,为从事编程行业的求职者提供了职位
参考。
参考文献:
[1]肖云鹏,戴天骥,吴欣虹.以招聘就业大数据为基础反馈教学的“校企学”服务模式思考[J].当代教育实践与教学研究,2018(05).[2]曾晗,吴际,胡健.人力资源外包机构面临的问题及解决方法——以中华英才网为例[J].现代商业,2018(17).
[3]苏洪爱.西部地区财会人才市场需求分析——以智联招聘网为例[J].现代商业,2016(5).
[4]熊畅.基于Python爬虫技术的网页数据抓取与分析研究[J].数字技术与应用,2017(09).
作者简介:
1.夏鑫雨,临沂大学信息科学与工程学院学生。
2.刘超达,临沂大学信息科学与工程学院学生。
3.李蕊,临沂大学信息科学与工程学院学生。
4.刘鸣涛 (通讯作者),临沂大学信息科学与工程学院,讲师,博士,研究方向:智能计算。