欢迎访问标准论文网!本站提供各专业优秀论文范文供大家学习参考。网站地图论文怎么写
在线咨询:
您当前所在位置:标准论文网 > 经济论文 >

大数据时代经济普查数据挖掘技术分析

添加时间:2019-05-17 09:09

  摘    要: 2018年为全国第四次经济普查的关键一年, 做好经济普查工作, 对发展我国经济具有重要的意义。伴随大数据时代的到来, 经济发展形势更加复杂, 国家政府既关注发展速度, 又关注发展质量, 这也是衡量国家综合实力的重要体现, 做好中国经济普查, 加强数据挖掘技术和方法研究, 对提高经济普查数据利用价值具有重要的意义。本文着重研究了经济普查数据分析的特征以及具体的数据挖掘技术, 以期为提高经济普查整体质量方面的探究提供一定的理论参考。

  关键词: 经济普查; 数据挖掘; 技术; 方法; 特征; 价值;

  当前我国经济发展进入新常态, 正处于转方式、调结构的关键时期, 为了进一步增强经济发展动力, 提高科学发展水平, 需要采取有效的措施对当前经济发展现状特征以及变化情况等进行动态分析和研究, 才能更好地提高经济决策科学化水平。大数据时代的到来, 数据日益庞杂, 且类型多样, 经济普查工作也面临诸多的挑战, 作为经济普查体系中的一项基础环节, 数据挖掘工作越来越受到重视, 加强经济普查的数据挖掘方法研究, 意义重大。

  一、当前我国经济社会发展背景及经济普查数据分析特征研究

  近年来随着我国改革开放建设进程深入推进, 国家经济发展水平持续提升, 做好经济普查, 能够及时全面收集与我国经济发展相关的数据, 总结发展规律和各项政策落实情况, 经济普查的对象为国家第二产业、第三产业所有的组织机构以及个体。随着行业交流融合速度不断提升, 越来越多的新行业不断涌现, 经济普查工作面临更大的挑战。
 

大数据时代经济普查数据挖掘技术分析
 

  经济普查工作呈现新的特征, 想要不断提高经济普查结果的科学性、有效性, 需要深入探究科学的数据挖掘技术和方法, 才能准确地对经济普查数据进行全面分析, 从海量的数据中查找到更多有价值的信息并根据情形做出适当的调整, 提高数据分析的深度。新时期经济普查数据分析呈现出新的变化特征。一方面受到大数据时代的影响, 分析结果对数据的准确性要求更高, 数据始终处于动态变化的过程中, 这主要是由于行业发展变化速度太快, 动态性比较强, 为了更加准确地把握数据分析变化情况, 需要对各个时间点的数据进行全面关注, 有的时间节点经济增长速度相对迟缓, 有的时间节点经济增长速度非常快, 这样会增加数据分析难度, 数据产生的误差概率也会增大, 这种情形下会增加经济普查数据分析难度, 这也是经济普查数据分析关注和控制的主要指标之一。另一方面开展经济普查数据挖掘和分析, 需要有专门的技术人员来积极参与, 他们的工作素质和能力对经济普查结果产生的影响也不可估量, 需要他们加强深入分析和研究, 采取有效的方式控制经济普查结果, 才能最大限度提高经济普查整体质量, 从技术层面讲还需要对经济普查数据分析过程加强成本管控, 这样才能更好地满足经济普查经济性要求。

  经济普查数据挖掘方法对经济普查数据整合分析整个过程产生的影响非常大, 在整体经济普查过程中都需要随时对采集的各类信息进行分类、整理和研究, 借助经济普查数据挖掘方法, 可以实现对各类结构化、非结构化以及半结构化的数据进行动态高效处理, 找出不同类型数据之间的关联性, 进而对经济发展相关决策的制定等提供更有价值的参考依据。

  二、大数据时代经济普查数据挖掘方法具体分析

  (一) 数据挖掘基本内涵

  数据挖掘是指通过借助某些工具和技术, 在数据库体系中将没有被人发现的一些内容进行提炼、总结和分析出来的过程。数据挖掘技术需要将海量的数据进行隐形价值提取, 将数据背后有价值的相关联的要素进行挖掘出来, 才能更好地提高整体深度处理水平。所以数据挖掘技术对经济普查工作影响非常大, 如果数据挖掘技术不够先进和科学, 将难以发挥应有的功能。

  (二) 大数据时代经济普查数据挖掘方法具体分析

  随着大数据时代的到来, 各类信息以海量的速度生成, 各行各业对信息的关注度越来越高, 对于经济普查工作而言, 普查规模不断扩大, 普查质量要求不断提高, 如何做好新形势下经济普查数据深度分析, 是当前经济普查人员研究和关注的重点之一, 现代统计软件、云计算、大数据等平台的开发和深度应用, 为经济普查数据挖掘分析提供了强有力的工具支持。通过针对具体的普查情况, 选择匹配的普查技术和工具对海量数据进行预处理和分析, 有助于更好地提高数据分析价值和效率, 目前在经济普查数据挖掘方面常用的技术或工具主要有以下几个方面:

  (1) SAS数据统计分析软件。SAS全称是STATISTICAL ANALYSIS SYSTEM, 是目前全球最大的软件公司之一, 最早是由美国的北卡罗来纳州立大学在1966年开发研究出来的一款它属于集成化与模块化的统计分析软件, 通常包含数十个专用的模块, 主要功能涉及数据访问、数据存储、数据开发与应用、图像处理、数据分析、报告编制、统筹学方法以及计量经济学等, 整体SAS系统可以设计成四大模块, 分别为SAS数据库模块、SAS分析核心模块、SAS开发呈现工具模块以及SAS对分布处理模式的支持及其数据仓库设计模块, 进而可以实现数据的访问、管理、动态显示和分析应用。随着SAS统计分析软件功能不断升级, 在数据访问、数据管理以及动态显示和分析等方面的功能越来越强大, 可以根据用户的需求不断扩大统计范围以及相应的分析功能, 借助SAS系统以及统计函数可以为客户提供更加便捷直观的数据展现。

  (2) SQL Server 2000 Analysis Services数据挖掘软件, 该类软件是由微软公司提供的一款数据分析软件, 可以为用户电子商务、数据仓库提供可伸缩性的功能服务, 该款软件大大缩短了数据开发和应用处理效率, 具有较强的业务拓展性能, 系统安全运行稳定, 使用便捷, 所以备受青睐。随着用户要求不断发生变化, 对各类复杂数据的分析要求不断提高, 该款数据挖掘技术软件也在不断进行升级和优化设计, 从而打造更具个性化的商务Web站点, 满足用户对数据深度处理的高难度要求。

  (3) 决策树工具。该类工具是指在已知到各项情况发生概率的前提下, 通过构建决策树体系, 从而计算出净现值的期望值大于等于零的概率情形, 进而对项目的风险进行测评, 为有关决策的制定提供相应的参考, 这是一种直观的概率数据统计分析图解法, 该类方法主要是构建一种树形结构模型, 在每个内部节点上进行树形功能测试, 建立测试输出通道, 从而将对象属性和对象值之间的映射关系进行关联分析, 加大深度预测和分析水平。通常由决策点、状态点以及结果点三大部分构成。需要使用者对各种情况的发生概率进行基本了解, 才能为后续分析图解等提供参考依据。应用决策树工具具有以下优势:一是理解比较方便, 且比较直观, 二是分析时间比较短, 能够进行快速处理, 三是测定模型比较简便。当然应用决策树工具还存在一些不足之处, 比如在数据分析处理精度方面还存在一些漏洞, 对于连续性字段往往很难进行预测, 误差相对较大。

  (4) SPSS数据挖掘软件, 该类统计软件应用也非常普遍, 是目前世界上最早采用图形菜单驱动界面的统计软件, 该款软件具有操作界面友好, 输出结果美观的优势, 通过构建预测模型, 可以在商业活动中提供重要的决策支持, 该款软件应用价值高, 且能够提供独特数据挖掘算法, 所以呈现出良好的数据挖掘优势, 目前应用非常普遍, 在医学分析、科研等领域应用也比较广泛。

  (5) Intelligent Miner工具。该类工具主要是通过应用多种挖掘算法、统计方法等, 从而可以实现对各类结构化、半结构化数据的深度处理, Intelligent Miner具有自动生成典型数据集、发现关联、发现序列规律、概念性分类和可视化呈现等强大的功能, 从而可以实现数据选择、转换、挖掘以及结果展现完善的数据挖掘功能, 并且还可以重复结果数据集过程, 更好地满足客户的需求。

  总之, 中国经济普查数据挖掘技术具有多种类型, 在具体应用过程中可以借鉴国外相关的统计处理等经验, 结合我国国情和经济普查不同时期不同阶段的要求, 选择针对性的数据挖掘处理技术, 才能不断提升数据挖掘效率和质量, 进而更好地发挥应有的功能, 夯实普查基础。

  参考文献:

  [1]金美琳.大数据时代的经济普查数据分析与研究[J].科技传播, 2016 (5) .
  [2]傅慕群.浅议大数据时代经济普查数据分析[J].山西农经, 2018 (12) .
  [3]赵珏.区域经济普查数据可视化分析系统的设计与实现[J].电子科技大学, 2015 (3) .
  [4]李孜晗.试论大数据时代的经济普查数据分析[J].纳税, 2018 (9) .