文档名:第四次经济普查-普查数据处理方案  作者:  
发布日期:2019/1/28  浏览人数:318

第四次经济普查-普查数据处理方案

okok 

第四部分  普查数据处理方案

 

为科学、高效、安全地组织第四次全国经济普查数据处理工作,根据《全国经济普查条例》、《国务院关于开展第四次全国经济普查的通知》,制定本方案。

一、基本原则

第四次全国经济普查数据处理工作按照“统一组织、分级负责,规范管理、注重质量,专业协同、各司其职,统筹规划、兼顾未来”的原则组织实施。

(一)统一组织、分级负责。

普查数据处理工作在国务院第四次全国经济普查领导小组办公室(以下简称“国务院经普办”)的统一领导下,分别由国家、省、市、县、乡五级普查机构组织实施。

各级普查机构要按照国务院经普办的统一部署,加强协调,做好统筹,在规定的时间内,按照普查业务流程和操作规范完成本级数据处理工作。

(二)规范管理、注重质量。

数据质量是统计工作的生命,是数据处理贯穿始终的根本遵循。第四次全国经济普查涉及范围广、业务环节多、技术要求高,各级普查机构必须明确分工,建立岗位责任制,压实责任,强化数据处理各业务环节的规范管理。

(三)专业协同、各司其职。

第四次全国经济普查调查内容丰富,数据处理工作涉及到多个部门和统计部门多个专业,各级普查机构要与部门间和在统计部门内部建立行之有效的沟通机制,既各司其职又分工协作,保质保量地完成普查的数据处理工作。

(四)统筹规划、兼顾未来。

数据处理工作既要充分利用统计信息化建设取得的丰硕成果,统筹数据处理方案的设计、基础数据处理环境的建设、软件系统的开发等普查顶层设计内容;又要充分考虑与统计信息化建设长远规划的关系,做好本次普查与下次普查的衔接、当前建设与长远发展之间的衔接。普查既要依托统计信息化,又要促进统计信息化,推动统计信息化向集约化方向发展。

二、工作内容和要求

(一)机构组建。

国务院经普办设立数据处理组,负责数据处理的组织实施工作。各级普查机构按照国务院经普办的组织形式,成立数据处理组或指定专门机构负责数据处理工作。各级数据处理组接受上级数据处理组业务指导,在本级经普办的领导下,负责组织实施本级的数据处理工作。

(二)方案与标准制定。

国务院经普办制定第四次全国经济普查数据处理方案、各项数据处理实施细则,规范数据处理各类技术标准和操作流程,组织协调数据处理各环节任务分配和进度核查。省级及省以下普查机构根据本地区实际情况制定本地区的数据处理方案和实施细则。

(三)经费申请。

各级普查机构要做好普查数据处理经费的申请和落实工作。确保普查数据处理软硬件环境及各类物资按时到位。

(四)数据处理环境准备。

第四次全国经济普查数据处理环境按照“1+1+13+18模式建设。国家统计局设立普查数据处理主中心和备份中心,组成普查国家级数据处理节点;各省级普查机构分别设立省级数据处理节点,其中13个节点由设立省级联网直报节点的省级统计机构在联网直报节点的基础上扩建,其他18个节点由未设立联网直报节点的省级统计机构在已有基础上扩建。各省级普查机构按照国务院经普办的要求,依照相应技术规范,负责本级数据处理节点的建设工作,各数据处理节点应按照普查数据处理进度要求及时到位并投入使用。

(五)普查软件准备。

国务院经普办统一组织普查数据处理软件开发。数据处理软件共5套,分别视需要在国家级及省级数据处理节点上部署。各级普查机构应按普查时间进度要求,提前完成综合试点、清查、普查登记及资料开发等普查阶段所需软件的部署工作。

(六)普查综合试点的数据处理。

为进一步检验普查方案的科学性、有效性,验证普查工作各项流程的合理性,国务院经普办决定在部分省(自治区、直辖市)开展普查综合试点工作。参与普查综合试点的省级普查机构要超前谋划普查数据处理环境的准备工作,确保全流程地进行综合试点。国务院经普办为综合试点的数据处理工作提供全方位的技术支持。

(七)数据处理试点。

国务院经普办选取部分地区组织数据处理试点工作。试点内容包括数据处理软件的使用、数据处理工作流程和组织实施等内容。各地区可根据实际情况组织开展本地区的数据处理试点。

(八)数据处理准备。

数据处理准备工作是做好普查各阶段数据处理工作的基础。主要包括单位清查和普查登记阶段数据处理环境的部署、普查基础地理信息框架的建立、普查区划分和部门数据收集等工作。各级普查机构要高度重视,不打无准备之仗,扎实细致地做好普查数据处理各项准备工作。

(九)单位清查阶段的数据处理。

单位清查工作是第四次全国经济普查的重要环节,为保证普查对象的不重不漏,各级普查机构应充分利用各部门提供的名录资料,做好部门数据整理、单位核实和清查数据采集处理工作,为普查登记阶段的各项工作做好准备。

(十)普查登记阶段的数据处理。

数据处理工作是决定普查成败的关键因素之一。各级普查机构应严格按照规范的数据处理流程,执行统一的数据处理标准,在规定的时间内做好数据采集、审核和汇总等各项数据处理工作,确保普查数据的一致性、完整性和及时性。

(十一)事后质量抽查的数据处理。

国务院经普办将按照《第四次全国经济普查事后质量抽查方案》,在全国抽取一定比例的普查区,对单位填报率、普查表主要指标的填报情况等进行质量抽查。

(十二)普查资料开发。

按照国务院经普办要求,各级普查机构要根据本地区需求,汇总加工与发布普查公报、普查年鉴,开展普查课题研究,并对普查数据进行深层次的开发利用。国务院经普办建立普查数据仓库和普查资料开发系统,为普查数据的开发利用提供技术手段。

(十三)普查数据处理工作总结。

各级普查机构在完成各阶段数据处理工作后,要对本地区的数据处理工作从业务和技术等方面进行全面总结。各省(自治区、直辖市)普查机构应将总结报告按要求及时报送到国务院经普办。

(十四)培训。

数据处理的培训工作采取分级负责的方式进行。国务院经普办负责培训各省(自治区、直辖市)经普办相关人员。各地区根据本地实际情况和需要开展培训。

(十五)技术支持。

国务院经普办采取培训、设立热线电话、现场技术指导等方式,负责各省(自治区、直辖市)普查数据处理技术支持工作。

(十六)部门数据处理。

部门数据处理工作以部门为主进行。各部门要制定有针对性的数据处理方案。根据部门的要求,统计部门可为其提供支持。部门数据处理工作结束后,应将普查基层数据和汇总数据按统一要求报送到同级普查机构。

三、普查数据处理环境准备

(一)国家级数据处理环境。

普查综合试点开始前,国家统计局利用现有设备和资源,搭建数据处理过渡环境,部署用于普查综合试点和单位清查数据处理的各种软件,满足普查综合试点和单位清查数据处理工作需求,为过渡到正式环境做好准备。20181031日前,完成数据处理正式环境的建设,满足普查数据处理工作要求。

(二)省级数据处理环境准备。

1. PAD的配备。

各省(自治区、直辖市)应根据实际情况,按照150家以下普查单位(含个体经营户)配备一台PAD的原则为普查员配备手持移动终端设备。统筹配备PAD的无线流量卡,确保满足普查数据处理各阶段的工作需要。

2.服务器及虚拟化平台配置。

配置6台四路PC服务器及虚拟化软件。其中,4台服务器用于搭建虚拟化平台,能承载4080个虚拟机运行,用于提供计算资源(CPU和内存),虚拟化软件包括企业版服务器虚拟化软件1套和16CPU的授权许可,用于管理、分配和调度系统资源。另外2台服务器用于普查数据库平台等。

配置中端存储阵列1台,容量不低于72TB,用于为虚拟化平台和数据库平台提供存储资源。配置光纤交换机2台,用于连接虚拟化平台主机和存储阵列。

3.系统软件配备。

配备不少于30套的国产Linux操作系统,1套数据库软件,1套应用中间件软件。

4.数据备份系统配备。

可用备份容量30TB以上,可根据业务需要进行扩容。支持数据库、文件、操作系统和虚拟机的备份和恢复;支持全量备份和增量备份;支持数据重删功能;支持LAN-Free备份和LAN备份。

5.连续业务保护系统配备。

连续业务保护系统提供服务器(包括操作系统、应用程序、数据库)一体化备份、一体化恢复、异机恢复等能力,可实现应用层的应急接管。

6.网络环境。

各省级节点互联网接入带宽应不低于200M,局域网带宽不低于1000M。配备万兆网络交换机2台,用于虚拟化平台主机的网络接入。配备负载均衡设备1台。

7.机房环境。

机房承重荷载、用电负荷、空调系统及供配电符合国家相应的标准规范要求。

8.设备配备要求。

设立联网直报节点的省级节点,除了满足上述设备配备要求外,还要通过补充相应软硬件、扩容身份认证系统等方式,升级改造联网直报系统,满足本省的一套表单位数据处理的需求。

9.数据处理环境准备的时间进度要求。

各地数据处理节点的建设工作,应按照普查综合试点工作、清查工作和普查登记工作时间节点的要求及时到位。

10.安全要求。

按照等级保护三级要求,在物理、网络、主机、应用、数据及备份等方面配置有效的技术手段和管理策略,划分网络安全区域,严格边界访问控制,配置应用安全监测、数据库扫描和防火墙、认证系统、态势感知、安全工作管理系统等技术措施,保证第四次全国经济普查数据处理系统具有一定强度的安全保障能力。

(三)地市、县和乡级数据处理环境。

各省级普查机构应加强规划,统筹省、地市、县和乡级数据处理工作的需要,结合实际情况,以集约、高效为原则,综合运用虚拟化、云计算技术构建数据处理节点基础计算资源和存储资源环境;按照基础设施即服务模式管理、分配和调度资源;完善数据备份和应用防护能力,做好安全系统建设,保障普查数据处理工作的安全。

四、普查数据处理软件准备

用于本次普查的数据处理软件共5套。

(一)普查区划分与绘图软件。

使用国家地理信息公共服务平台“天地图”为电子底图,在第三次全国经济普查普查区划分的基础上,根据统计用区划进行各级边界的确认与调整,普查小区的划分、命名、编码和审核,形成第四次全国经济普查普查区电子地图。软件在国家级数据处理节点部署。

(二)单位清查比对处理软件。

该软件在国家级和省级数据处理节点分别部署,并主要包括:

1.部门数据整理。对部门单位名录资料与统计基本单位名录进行比对、合并,生成单位清查底册与个体经营户清查底册。

2.清查数据处理。接收PAD上传的清查数据,并进行编码、审核、汇总、查疑补漏、上报和验收等,整理形成联网直报普查单位名录、PAD填报普查单位名录和部门普查单位名录。

(三)PAD数据采集软件。

包括PAD的管理与数据的采集。

1. 移动终端管理平台(MDM)。负责PAD的注册管理;负责PAD软件、制度、底册、普查区电子地图等信息的推送。软件在国家级和省级数据处理节点分别部署。

2.PAD清查数据采集。普查员根据清查底册对清查单位(含个体经营户)进行核查,填报清查表,同时对清查单位所在建筑物进行标定,将单位与建筑物进行关联。

3. PAD非一套表单位及个体经营户数据采集。普查员使用PAD,根据普查名录采集非一套表单位数据和个体经营户样本单位数据,并进行审核、编辑、查询、导出、上报等处理。

4.PAD事后数据质量抽查数据采集。用于完成事后质量抽查的数据采集工作。

(四)普查数据处理软件。

数据处理软件主要完成以下工作:

1.一套表单位数据采集处理。一套表单位利用国家统计联网直报平台进行数据报送。各级普查机构对采集的数据进行审核、编辑、验收、查询、汇总和数据导出等处理。软件在国家级和13个省级联网直报节点分别部署。

2.非一套表单位和个体经营户数据处理。接收PAD采集的非一套表单位数据和个体经营户样本单位数据;支持各级普查机构统一组织的非一套表单位的数据排重。对非一套表单位和个体经营户样本单位数据进行审核、编辑、验收、查询、汇总和数据导出等处理。软件在国家级和13个省级联网直报节点分别部署。

3.事后质量抽查数据处理。用于完成事后质量抽查数据的接收、审核、比对和汇总分析等工作。软件在国家级数据处理节点部署。

4.数据同步。实现多源异构数据的整合入库工作。将一套表单位、非一套表单位的数据和部门的数据经过清洗、转换、合并(ETL),形成统一的数据资源。软件在国家级和13个省级联网直报节点分别部署。

(五)资料开发与分析软件。

用于资料开发与数据分析。软件在国家级数据处理节点部署。

五、单位清查阶段的数据处理

单位清查数据处理工作分为以下三个阶段:

(一)准备阶段。

1.制定实施细则。各级普查机构根据本地区实际情况,制定本级清查数据处理实施细则。

2.软件部署与培训。各级普查机构应于清查工作开始前完成单位清查数据处理各类软件的部署与培训工作。

3.普查区划分。国务院经普办统一提供本次普查使用的电子地图。地图采用2000国家大地坐标系,普查区边界是根据第三次全国经济普查普查区划分成果进行乡界融合形成。

省级及省以下普查机构根据截至20186月的统计用区划逐级对本级边界进行核定与调整。乡级及乡以下边界的核定和划分,由县级普查机构组织完成。通过普查小区边界的划分、调整、命名和编码,形成15位普查用地址码和普查(小)区电子地图。

4.部门数据整理和清查底册的准备。省级及省以下普查机构使用单位清查比对处理软件,以统一社会信用代码(或组织机构代码)、单位名称等为关联信息,对收集到的部门名录资料与基本单位名录进行比对、合并与整理,生成单位清查底册。有条件的地区可建立个体经营户清查底册。

5.清查任务分配。县级普查机构通过移动终端管理软件统一对PAD进行远程管理,制定安全策略,并根据任务清单进行清查任务分配,推送PAD清查软件、单位清查底册、清查制度和普查区电子地图等清查任务包。普查员接收任务包并进行加载。

(二)“地毯式”清查阶段。

1.清查数据采集。县级及县以下普查机构组织普查员对所辖区域内的全部清查对象进行“地毯式”逐一清查。普查员通过PAD获取单位(含个体经营户)所在建筑物的坐标,采集地址点信息;根据清查底册,对单位进行核实、标注,采集单位和个体经营户信息并上传。

2.清查数据处理。清查数据处理系统接收普查员上传的清查数据,各级普查机构逐级对清查数据进行编码、审核、查询、更正和汇总等。

3.查疑补漏。县级普查机构根据市场监管部门提供的新增单位、统计调查发现的新增单位,清查数据与清查底册中的差异情况,法人单位和产业活动单位关联审核情况等,建立查疑补漏单位底册,开展查疑补漏工作。

(三)单位名录生成阶段。

国务院经普办分类标记一套表单位、非一套表单位,以及金融、铁路等部门负责普查登记的单位,生成一套表单位、非一套表单位名录和个体经营户样本单位名录。

六、普查登记阶段的数据处理

普查数据处理工作分为四个阶段:

(一)普查数据处理准备阶段。

1.制定实施细则。各级普查机构根据本地区实际情况,制定本级普查数据处理实施细则。

2.软件部署与培训。各级普查机构应于普查工作开始前完成普查数据处理各类软件的部署与培训工作。

(二)普查登记与数据采集阶段。

1.一套表单位数据采集和上报。一套表单位通过国家统计联网直报平台在线填报普查表。

2.非一套表单位数据采集和上报。原则上普查员使用PAD采集非一套表单位普查数据和初审,并通过无线网络上传。

3.个体经营户样本单位的数据采集和上报。普查员使用PAD入户采集个体经营户样本单位数据和初审,并通过无线网络上传。

(三)数据审核和汇总阶段。

1.数据检查。对抽选的普查小区全部已上报单位进行数据质量检查。

2.数据审核与验收。各级普查机构对数据逐级进行审核,发现问题退回核实修改。上级普查机构按照标准验收下一级数据。

3.数据合库。省级节点的数据与国家实时同步;一套表单位和非一套表单位定时进行合库。

4.普查数据汇总。各级普查机构根据国务院经普办的要求,完成数据的快速汇总、全面汇总和专题汇总等工作。

5.事后质量抽查。按照《第四次全国经济普查事后质量抽查方案》的要求,组织开展事后质量抽查。抽查人员通过PAD采集和上传数据,并利用事后质量抽查软件对数据进行汇总分析。

6.部门数据处理。各部门按照国务院经普办的要求,报送本部门的基层数据和汇总数据。

(四)普查资料开发与发布阶段。

国务院经普办建立全国经济普查数据仓库。各级普查机构按照国务院经普办要求和本级数据加工需求,汇总和发布普查公报、年鉴和课题研究数据等,并对数据进行深层次的开发利用。

七、数据安全

为保障第四次全国经济普查数据安全,防止数据因各种原因造成的篡改、丢失、泄漏、破坏等安全风险,各级普查机构应按照《网络安全法》的要求,将《国家统计信息系统数据安全管理办法》落实到普查工作的各个环节,并重点做好以下工作:

(一)确保数据处理系统物理环境安全,按照机房建设相关国家标准,做到防火、防盗、防水、防雷等,并设置门禁和监控设施,做好物理访问控制和监控审计。

(二)数据处理系统应部署在等级保护三级安全区域,按照等保三级标准进行管理防护。

(三)做好系统账户和口令安全管理。应分别设置系统管理员、安全管理员、审计员和一般用户等账户,并禁用默认账户;口令应至少8位以上,大小写字母、数字、特殊字符两者以上的组合。

(四)严格账户权限管理,应根据实际业务需求,以最小化、动态调整为原则分配账户权限,实施访问控制策略,严禁非授权数据访问。

(五)形成安全检测和整改加固工作机制,定期对数据处理系统的主机操作系统、应用软件、数据库、中间件等进行安全检测,以及系统上线前和更新后的即时安全检测。并制订管理流程,对检测发现的漏洞和风险及时整改加固,确保数据系统环境安全。

(六)做好数据处理系统和普查数据的安全监测和日志审计。普查数据处理工作期间,应实时监测,及时发现异常并予以处置,有效控制安全风险;应指定审计管理员,对普查数据安全日志定期审计并形成审计报告。安全监测日志应妥善保存,保存期不少于6个月。

(七)建立数据访问使用审批制度,严禁非授权访问,避免数据泄漏、篡改等情况,保证数据访问和使用安全。

(八)加强数据处理系统相关人员安全管理。如,内部人员须经安全培训,离岗、离职时应及时取消其帐号和权限等。对外包服务人员应签署保密协议,并监控检查其对数据的操作行为等。

(九)制定数据备份和应急策略,定期进行数据备份和恢复测试、演练应急预案,确保应急事件发生后数据及时恢复。

(十)数据处理系统的培训、测试等环境,应按照生产环境的安全管理办法进行管理。数据处理系统停止使用并按计划报废时,应做好系统废止和销毁的安全管理,禁止数据残留和泄漏。

八、质量控制

(一)按制度规定处理数据。各级普查机构要按照普查方案规定,采用统一的数据采集处理平台和规定的软件,在确保数据安全的工作环境下,对普查数据进行整理、加工、计算和汇总。

(二)数据加工处理方法要科学。要加强数据加工处理方法研究,保证数据加工处理方法科学合理;充分测试数据处理软件,保证数据处理软件可靠性。

(三)查明数据加工处理过程的疑点。要在规定时间内查明数据加工处理中发现的疑点和问题,认真分析原因。

(四)保证数据时效性。要配备充足的力量进行数据加工处理,强化数据加工处理每一个环节的时间管理,制定切合实际的进度表,保证数据处理按时完成。

(五)规范数据反馈。各级普查机构应按照制度规定向下反馈数据。反馈数据如经过修正或调整,应同时反馈修正理由和依据。

九、时间进度安排

(一)普查区划分与绘图,20187月下旬-8月。

(二)部门数据整理和编制清查底册,20187-8月。

(三)单位清查数据采集、处理和编制普查名录,20188-1210日。

(四)普查数据处理软件联调和部署,201811月底前。

(五)普查登记前的数据准备,201812月底前。

(六)普查登记与数据采集,20191-4月。

(七)普查数据处理,20199月底前。

(八)普查资料开发与数据发布,20196月开始。