随着云计算、人工智能、物联网等新兴技术的不断发展,新一轮科技革命和产业变革蓬勃兴起。同时,催生出海量数据与丰富应用场景,如何挖掘数据价值并实现创收成为数字化企业难题。致使数据分析岗位需求高涨,相关求职者热切关注市场。因而,研究数据分析岗位的需求状况以及薪资的影响因素,无论对于企业寻找数据人才,制定合理招聘计划,还是帮助数据分析岗位求职者获取市场信息,客观评价自身价值均有重要意义。
本文通过八爪鱼采集收集器爬取 2022 年 11 月 14 日前程无忧网站的招聘启事,获取关于数据分析岗位的文本数据。本文共分为三大板块主体内容,一是对数据进行预处理工作,完成对非结构化数据的分词处理,对结构化数据进行数据清晰、数据转换以及 one bot 编码。二是运用文本分析、描述性统计对数据分析岗位进行需求分析一)从城市角度出发,绘制地理位置热力图,探究不同城市的数据分析岗位的需求状况以及不同城市的平均薪酬,发现上海数据分析岗位需求占比高达 20.7%,一线城市与新一线城市的数据分析岗位平均月薪薪酬较高,分别为 1.75 万与 1.25 万。(二)从求职者需求角度出发,绘制不同学历的薪酬增长曲线,发现一年工作经验求职者的平均薪资大多低于应届生求职者。比较不同行业的数据分析岗位薪酬,信息传输、软件和信息技术服务业的平均月薪最高,高达 1.67 万,其次是科学研究和技术服务业,公共管理、社会保障和社会组织,金融业,平均月薪分别为 1.58 万、1.49 万、1.46 万。根据企业福利标签词云图,企业想要吸引求职者,不仅应该考虑基础的就业保障与薪资构成,也需要考虑时代问题,合适地关怀求职者需求以及传达企业文化。(三)从企业画像出发,分析招聘数据分析岗位的企业画像,民营企业占比高达 67%,绝大部分数据分析岗位并不在“铁饭碗”企业中。三是运用关联规则分析、随机森林方法探究数据分析岗位薪资的影响因素。基于 Apriori 算法进行关联分析,发现薪资较高通常与“一线城市”、“本科”等挂钩,说明学历城市对薪资的重要影响。而数据支持度较低,侧面反映人生际遇不同,薪资水平并不能被完全人身上的标签所框定。根据随机森林模型,发现学历、经验、工作地点以及公司规模对于薪酬的影响程度较大。
基于以上结论,本文给出三点建议。针对企业,应当关注人才需求,招聘福利标签应贴近时代背景。如“996”、弹性工作等。针对高校学生,应关注市场需求,合理规划职业生涯,提高个人能力与职业特点之间的匹配度。针对高等院校,应紧跟时代发展,加强高校人才培养。重视学科交叉领域建设,注重实践课程,加强校企合作,全面提升学生能力。

付费可得论文全文+数据+代码+汇报PPT