人社大数据平台的建设与应用研究探析
发布时间:2019-07-27
摘要: 大数据与各行业间的合作已经成为趋势,根据河北省人社系统信息化的现状, 以及目前国内外人社大数据平台的发展, 本文提出利用通讯公司的信令数据和人社大数据彼此之间的数据共享和价值 再造, 实现数据的进一步深度挖掘, 利用大数据技术、 GIS 技术和数据挖掘技术, 推进人社公共服务信息化应用的推广, 推进社会信息化, 提升人社服务水平和监管决策能力。
关键字: 大数据; 人社; 信息化平台;
监管决策随着我国社会保障事业的快速发展,已经初步建成了社保公共服务体系,社保的覆盖范围迅速扩大,参保的人数和资金也不断增长。但是人社数据信息整合力度不高,统计调查力度有限,统计数据信息公开力度不够,数据对服务决策、服务管理、服务社会的巨大潜力并没有开发[1]。因此,建设统一共享的人社数据平台具有非常现实的意义。
人社大数据平台的建设,主要是利用大数据技术、GIS 技术和手机通信数据,进一步挖掘数据的更深层次的价值,如可以对于劳动力的迁徙、就业、居住等情况进行目标性、区域性的监控、跟踪和预警,从而推进社会公共服务信息化的发展,进而提升整个社会的信息化水平,提升人社部门的服务水平以及监管决策能力。
1 人社大数据平台的系统功能分析
大数据在各个行业的应用与服务已经成为了趋势,通过数据之间的共享和价值再造以及数据之间的进一步挖掘,可以提升统计分析的功能和准确率。由于通讯公司的信令数据与人力资源与保障厅的数据的格式以及信息化程度都不尽相同,对于数据的融合和挖掘需要逐步进行,要先对相关数据进行筛选,对数据格式进行统一制定,并且对数据业务应用进行统一建模。
1.1 大数据平台人员责任分析。人社大数据平台建立主要涉及的人员是人社部门的技术人员以及通信公司的技术人员,这些人员负责对人社数据以及通信数据进行加密、传输、建模以及分析输出结果。
人社厅技术人员负责将数据进行加密和传输,然后通过通讯部门的专线进行传输,运用双方约定好的方式进行解密;通信公司技术人员进行通信信令的采集,将数据进行存储或传输。双方根据业务需求进行建模,根据模型数据进行分析,分析结果可视化展示,展示方式可以是图表、图标、热力图等。人社大数据平台的系统构成图如图 1 所示。图 1 人社大数据平台系统构成图
1.2 大数据平台的功能性分析
1.2.1 功能需求。利用人社部门提供的人员身份信息,例如籍贯、年龄、参保、应往届毕业生等,结合通讯公司的位置信息等数据,根据业务模型分析出省内人口迁徙、劳动力来源、大学生就业分布等情况。
1.2.2 维度分析。根据需求,可以从多个维度进行分析。例如,可以根据年龄数据,分析迁徙人口的年龄分布;根据性别数据,分析迁徙人口的性别分布;根据 ARUP 值(用于衡量电信运营商业务收入利润的指标),分析迁徙人口的消费分布。
1.2.3 建模需求。该系统平台是以业务需求为驱动力,借助于通讯公司的用户位置数据、资料数据、消费数据等,利用身份数据进行关联,使得通讯数据和人社数据进行初步融合、统一建模,建立起针对人口迁徙、人口流动、大学生就业的分析模型。结合过往的历史数据,实现对重点地区、行业、企业的用工趋势分析,为劳动力的就业趋势提供预测,为就业者提供就业机会,为政府以及用工市场提供决策依据[2]。
2 人社大数据平台的数据采集
人社大数据平台的数据主要来源于人社部门的基础数据以及通讯公司的信令数据两部分。
2.1 人社部门的数据采集。对于人社数据的采集,可以分成两种情况,一是通过人社部门提供的 FTP 服务器,数据平台负责从指定的接口进行采集,采集后的数据加密后存放在指定的接口机;二是通过人社信息系统在通信公司指定的 FTP 机器上存放文件,然后从FTP 机器上采集文件进行机密存放[3]。
2.2 通信公司的数据采集。通讯公司将相关用户的身份及位置信息生成文件,并将文件进行加密存放在指定的接口机,这样,接口机上的所有数据文件都是加密存放的。接口机和 FTP 服务器,都要求通过申请访问来确保信息的保密性。为了数据采集时的安全,在整个数据采集过程中可以采用三层数据处理。
2.2.1 确保接口机安全。人社数据资料和通讯公司用户身份等信息资料通过加密后存放在接口机,该接口机的秘钥需由专人统一掌握,接口机不允许私人访问,非管理人员必须通过申请访问[4];接口机上可以允许处理数据程序,进行解密以及人社数据和通讯公司数据的匹配。
2.2.2 接口机处理安全。匹配成功后人社资料信息直接加密入库人社存储专区,通过 MD5 不可逆进行加密[5]。匹配失败的人社资料信息直接传递给通讯公司的指定接口机。集团客户查询返回用户资料入库到通信公司的资料库。
2.2.3 数据访问安全。关键字段进行 MD5 加密。视图权限可以放给人社存储专区库用户。人社数据存储的专区库相对独立,需要的访问权限相对较高。数据解密过程可以由下图进行描述:
3 人社大数据平台的应用
以人口流动分析模型为例,分析的结果是身份信息为本省不同人群的迁徙特征,按照劳动力的组成进行分类,从而整体分析人口流动的迁徙情况,并将最终的分析结果通过 GIS 等图表的形式呈现出来,通过这样直观的数据分析来及时更新重点区域的劳动力组成以及不同人群的迁徙情况。
3.1 人口流动分析模型的建立。根据全省整体人口的迁徙特征主要分析属于某省份户口的人员外迁情况,根据该省份的通讯公司采集到的信令数据,分析人员的位置、迁徙轨迹、长期居住地、工作地以及在各地区的居住时长。
利用省人社部门提供的用户社保信息,以及该用户的通讯位置信息,分析该省缴纳社保用户在全国其他地区的分布情况,这可以非常方便的查询该省向其他地区的迁徙情况,并将这些信息以报表和 GIS 地图的形式进行形象的展示。
3.2 人口流动模型数据处理流程分析。人口流动的平台处理流程见图 2 所示,首先选取常驻信令 6 个月的相关数据,从该数据中提取出去过同一个城市或者地区 3 次以上用户的用户编码、工作地点,然后提取去过研究区域 3 次以上的用户的信息,将提取出的两种用户信息进行关联,得到该人群的年龄区间、性别、消费层,再通过用户资料表来提取用户的身份信息,从而在相关的地区表上提取对应的地市区号。
4 结束语
在大数据的背景下,本文提出了一种利用人社数据以及通讯信令数据进行整合分析,设计建立人社大数据分析平台的设计思路。该思路具有一定的创新性和实用性,但在实际系统搭建时,还要对硬件设备、系统潜能、系统进行更进一步的优化,对关键算法和代码进行深一步的探讨,对数据库设计进行规范,以合理搭建高效运行的系统平台。
参考文献
[1] 黄涛. 人社大数据分析系统设计与实现 [D] . 济南: 山东大学, 2016.
[2] 陈佳, 胡波, 左小清, 等. 利用手机定位数据的用户 特 征 挖 掘 [J] . 武 汉 大 学 学 报: 信 息 科 学 版, 2014, 39 (6): 734 ~ 738, 744.
[3] 包婷, 章立刚, 金澈清. 基于手机大数据的城市人口流动分析系统 [J] . 华东师范大学学报 (自然科学版), 2015 (5): 162 ~ 171.
[4] 赵时亮, 高扬. 基于移动通信的人口流动信息大数据分析方法与应用 [J] . 人口与社会, 2014 (3): 20 ~ 26.
[5] 马冬梅. 关于移动通信网络与大数据的探讨 [J] . 通信设计与应用, 2014 (17): 10 ~ 13.
人社大数据平台的建设与应用研究探析相关论文期刊推荐:微信平台在外科学教学应用