核心观点
本研报基于某招聘网站发布的50多万条招聘信息数据,利用数据挖掘技术对网络招聘信息进行分析,旨在了解社会和相关行业的需求特点与趋势,为广大求职者提供正确的就业指导。
研究方法
- 数据预处理:对结构化数据进行数值化处理,对非结构化数据进行去重、去空、中文分词和停用词过滤。
- 文本向量化:基于TFIDF权重法提取关键词,构造词汇-文本矩阵,并利用SVD进行语义空间降维。
- 文本聚类:通过k-means聚类算法对职位进行职业类型和专业领域的划分。
- 需求分析与预测:构建排名算法判断热门行业、职位、地域,并引入时间因素预测短期人才需求走向。
- 关联规则挖掘:对大数据相关职位进行关联规则挖掘,分析其需求增长趋势、行业分布情况、地域分布情况、行业职位特征、行业薪酬情况以及技能要求。
- TSI人才紧缺指数:计算TSI人才紧缺指数,深入分析IT行业在地域、职位、学历方面的供求现状。
研究结论
- 热门需求:移动互联网、金融、电子商务·金融、移动互联网·金融、电子商务是热门行业;后端开发、运营、销售、视觉设计、编辑是热门职位;北京、上海、深圳、杭州、广州是热门地域。
- 人才需求走向:热门地域和企业对学历的需求大多以专科本科为主,对工作经验的要求大多在1-3年;热门行业和职位的需求在短期内仍会持续增长。
- 大数据职位需求情况:大数据相关职位主要集中在移动互联网、电子商务、金融等行业,地域分布上“北上深杭广”等特大一线城市占据主导地位;薪酬水平高于行业平均水平;主要工作对象是后端开发、运营和产品,其次为DBA、用户和市场;要求应聘者具有良好的数据分析能力和数据变现能力。
- IT行业供求与发展:北京地区IT行业人才供给量大于人才需求量,呈现供过于求的现状;网页设计/制作以及软件工程师的人才紧缺指数较大,呈现供不应求的现状;大专学历和硕士人才紧缺指数较大,呈现供不应求的现状。
- 人才培养建议:统计学专业应积极应对大数据时代的挑战,转变思维模式,增设相关课程,联合多院系培养复合型人才,注重实践操作,加强校企合作,培养创新型人才。