“一带一路”沿线国家经济管理类数据库资源分类体系构建
发布时间:2021-04-21
摘要构建“一带一路”沿线国家经济管理类数据库资源分类体系对提高的资源整合与共享效率有重要作用。文章调研11个“一带一路”专题数据库中的分类体系,从分类对象、分类维度、类目设置、类目结构、类名组合和分类标准的角度分析特点与不足,参考经济学理论、国家标准和统计年鉴的类别划分与统计指标,构建由3个基本大类、33个二级类目,245个三级类目和6个复分表组成的分类体系,以对内容复杂、类型多样和来源分散的“一带一路”经济管理类信息资源进行分类。
关键词分类体系经济管理数据库“一带一路”
0前言
“一带一路”倡议提出以来,得到国际社会积极响应,截至2020年12月17日,已有169个国家和国际组织参与[1]。近年沿线国家的经济合作规模不断扩大。据我国商务部统计,2020年1-10月我国企业在“一带一路”沿线国家直接投资额达983.4亿人民币,同比增长24.8%[2]。随着“一带一路”建设推进,各国对经济信息的需求越来越旺盛。经济管理信息资源(以下简称“经管信息资源”)在促进生产要素流动、改进生产经营方式、优化经济决策机制方面起到极为重要的作用,对国家竞争力以及企业发展态势有重要影响。构建“一带一路”经管信息资源分类体系在满足现实需求、指导建库实践具有较强的现实意义。首先,“一带一路”经管信息资源具有内容复杂、类型多样和来源分散的特性,对信息价值的发挥造成一定障碍;从内容和类型看,“一带一路”经管信息资源包括各国概况、政策法律、项目工程、产业发展、投资贸易和企业概况等;从来源看,主要来自统计部门、图情机构、科研机构、新闻媒体、企业、商会和跨境产业园区等部门,因此需建立分类体系对信息资源进行序化和整合,促进数据治理,以发挥其价值。其次,从实践层面看,我国已创建的33个专题数据库中,尚未出现统一的资源分类体系,用户在检索相关资料时需适应不同的分类体系,造成不便。此外,我国对“一带一路”经管类信息组织与整合的研究较薄弱,对其领域分类体系尚无过多探讨。综上,需构建一个统一的、适用于多类型、多来源的信息资源分类体系,以辅助资源的多方采集、统一组织和跨库检索。笔者首先调研现有专题数据库中经管信息资源分类的现状,吸收其合理内容,再借鉴经济学理论、国家标准和统计年鉴的分类标准,以完成分类体系的构建。
1“一带一路”专题数据库经管信息资源分类现状
为了解“一带一路”经管信息的主题内容和分类方法,笔者在调研33个专题数据库的基础上,从中筛选出涉及经管领域分类体系11个数据库,从分类对象、分类维度、类目设置、类目结构、类名组合和分类标准的角度进行分析。具体见表1。
(1)分类对象主要集中在宏观经济领域。所调查分类体系中,8个(占72.7%)收集宏观经济信息,如经济总量、国民经济结构、财政收支和民生情况;4个(占36.4%)涉及部门经济的内容,其中贸易、能源、交通、旅游是较常见的类目;2个(占18.2%)对沿线国家的重要企业信息进行分类。
(2)分类维度包括内容特征和数据特征。内容特征主要指经管信息的描述对象和所属行业,具体类目如国民经济核算、投资贸易、工业增加值;数据特征指时间跨度、载体形态和所属地区等。专题数据库大都按内容和数据特征生成不同的分面,再通过分面组配提供多种浏览和检索途径;少数数据库,如中经网一带一路统计数据库依次从地域、经济指标对数据进行层层划分,形成一个树状等级结构以供浏览和检索[3]。
(3)类目设置差异较大。首先是类目数量不均衡。专题数据库中一级类目最多的有18个,最少仅2个;二级类目最多有177个,最少仅6个,有的甚至只有一级类目而未设置二级类目。其次,数据库之间分类粒度粗细程度不一,相同类目在不同分类体系中的层级不一;如“国民经济核算”在“一带一路”研究与决策支撑平台中为一级类目[4],但在CSMAR中是二级类目[5]。
(4)类目结构扁平。大部分类目控制在1-2级。该列类方式虽然直观性强,能较快了解数据库内容的主题分布[6],但分类粒度粗糙,资源属性揭示缺乏精度。其次,具有从属关系的类目被归入到同一级的现象较普遍;如中国一带一路网将就业人员和第一、二、三产业就业人员列为同一级,将能源消费总量和石油、天然气消费总量列在同一级[7],造成此类目下位类数量众多且类目间关系混乱。
(5)类目名称随意。大部分类名属于合成词,但组合没有固定的标准,类名缺乏规范控制,同类不同名的现象较为普遍。如有关人力资源的类名有“劳动力市场”“人口与就业”“就业和工资”“劳动与社会保障”[8]。其次类名的组合缺乏逻辑性,部分相关性不强的类目被组合在一起如“农业矿产”“文化旅游”[9]。
(6)分类标准不一。对同级类目的划分标准存在差异,分类体系前后不协调。比如,色诺芬(SINOFIN)一带一路专题库中,“宏观统计”类目先按地域属性分为“中国区域宏观”“各国宏观”,再依照相的经济指标划分下位类;但“贸易往来”未按照国家分类,而是将国别与经济指标组合成如“中国对外贸易-出口货物”“各国进出口数据(HS2002-2010)”的类目[10]。
从调研结果看,专题数据库的分类对象主要集中在宏观经济领域,内容特征和数据特征是较为常见的分类维度。仍然存在类名组合随意、类目数量失衡、分类标准不一的问题。
2“一带一路”经管数据库资源分类体系的设计
“一带一路”经管信息的复杂性决定其分类体系不能简单地依照已有的文献或学科分类法进行构建,需要依据经济运行和管理活动的实际,参照统计部门和标准化部门的统计指标与类别划分,多维度地揭示资源特征。笔者以此为原则确定分类体系,主要由基本大类、主表和复分表构成,从经管信息的内容、地域、时间、来源、类型等多个属性进行划分。
2.1基本大类的确定
关于经管资源的分类,尚未形成统一的观点。笔者参照3种标准确定基本大类,即经济学上的划分、经济信息的分类以及专题数据库的资源分类。
(1)凯恩斯的分类,凯恩斯认为“经济学一方面是从整体来看的产量和就业理论,另一方面则是单个行业或厂商理论”[11],实际上是将经济学分为宏观经济学和微观经济学。
(2)经济信息的分类,经济信息分类和组织受经济活动的影响,经济活动有宏观和微观之分,相应地经济信息也就区分宏观和微观[12]。该二分法虽然为经济资源分类提供借鉴,但并不能完全涵盖“一带一路”经济管理类信息资源。
相关知识推荐:怎样在期刊上发表论文
(3)专题数据库的资源分类,当前专题数据库的调研显示,资源大体包括3个部分:①沿线国家的经济总量、增长与波动和人民生活等信息(属于宏观经济);②单个企业或组织的基本信息、生产经营和财务状况等情况的信息(属于微观经济);③具体部门的生产总值、增长情况和内外投资等情况的信息,该部分暂时无法归类,所以需增设“部门经济”对专指某部门的信息进行归类。
综上,将基本大类设定为宏观经济、微观经济和部门经济3大类。
2.2分类标记系统的设计
分类体系的标记系统是指全部类目的标记符号及其构成的整体联系,需要在构建具体的类目体系之前进行设计[13],以明确类目的代码、显示类目间的关系,主要包括标记符号和标记制度两方面。主类表中“宏观经济”、“微观经济”和“部门经济”3个一级类目分别使用大写字母“A”“B”“C”,二、三级类目使用数字代码(不带0的双位数字);复分表的类目沿用国家标准对应标准中的代码,未使用国家标准代码的使用自编代码;主类表中的二、三级类目采用双位制标记。除此之外,主表类号和各个复分表类号之间用“.”分隔,以示区别。
2.3主表的设计
2.3.1“宏观经济”类目细分
类目细分应遵循实用性和科学性原则,不仅要覆盖“一带一路”宏观经济信息,也要符合相关部门统计惯例,下面详述细分过程。
(1)对类名进行规范化处理。各专题数据库分类体系的类名不尽相同,同类异名和类名交叉问题较普遍,需进行规范化处理。具体措施包括统一相同类目的不同表述、合并从属类目、拆分或删减合成词,对内涵较广且外延较大的术语进行拆分,如将“国民经济账户”拆分成国内生产总值、资本形成总值、最终消费支出、货物和服务进出口。
(2)二级类目的划分。第一,对类目进行频次统计和内容分析。目前专题数据库中的宏观经济类目包括10个方面:从整体结构上对国民经济的存量和流量、资金流和物流、国内和国外交易进行描述的信息,如国内(地区)生产总值、资本形成总额和国际收支;人口信息,如自然增长率、老龄化程度;基础设施信息,主要包括通信和交通;财政信息,如税收、政府决算;人民生活信息,包括居民收入、居民消费和贫困等;投资信息,如利用外资、基础设施投资和对外投资;价格信息,如居民消费、商品零售和消费者价格;就业信息,如就业、失业人员;各部门经济的总量信息,如制造业、贸易、金融;这部分与“部门经济”稍有重合,为避免类目重复,暂不列在“宏观经济”下;与经管并不直接相关但对其发展有较大作用的文化、社会信息;如教育、科技和卫生。根据表1列举的9个专题数据库(“一带一路”大数据库“丝路信息网”的产业统计数据库和重要企业库除外)中12个宏观经济分类体系,统计规范化处理后的类目频次,将出现2次及以上的类目列于表2。
第二,借鉴《中国统计年鉴》类目。专题数据库中有关国民经济总量和流量的指标,如国内(地区)生产总值、国民总收入、货物和服务进出口和国际收支,在《中国统计年鉴(2020)》[14]中归为国民经济核算部分,据此,在分类体系中将国民经济核算设为二级类目;与投资相关的类目如基础设施投资、利用外资,在《中国统计年鉴(2020)》(以下简称《年鉴》)中归为固定资产投资部分,因此在分类体系中将固定资产投资设为二级类目;有关基础设施的类目在《年鉴》中归为部门经济类目,即“运输、邮电和软件业”和“对外经济贸易”,因此将基础设施划归到“部门经济”中。由此,宏观经济大类下的二级类目划分为人口、国民经济核算、就业和工资、价格、人民生活、财政、固定资产投资和其他8类。
(3)三级类目的划分。三级类目的划分参考专题数据库已有类目,结合《年鉴》的经济指标作补充,并对部分类名进行校正。具体情况如表3所示。
2.3.2“微观经济”类目细分
“微观经济”的分类需兼顾现实性和稳定性。分类体系不仅应如实全面地反映企业的经营现状和发展态势,也应符合统计惯例和用户习惯。由于专题数据库中的企业经济指标较少、涉及企业不多,所以参考中国工业企业数据库中的指标进行细分。该数据库由国家统计局根据企业提交的季报和年报建立,样本企业数目达34万家,观测值435余万个[15],涵盖上百个指标,包括企业标识码、营业状态、主要业务活动、生产销售及职工情况等基本信息和财务信息,符合现实性要求;用户基础深厚,分类体系稳定性强。通过对该数据库中的指标进行梳理发现,“微观经济”下的二级类目可以细分为基本信息、生产管理、经营与销售、资产负债、投资融资、税收补贴、对外贸易、雇佣行为和其他9类,如表4所示。
2.3.3“部门经济”类目细分
二级类目细分的主要任务是将国民经济中的重要部门具体化,分类结果不仅要符合行业分类标准,还要能够涵盖现有“一带一路”部门经济的信息。笔者在对专题数据库中的部门经济类目进行统计的基础上,参照《国民经济行业分类(GB/T4754—2017)》[16],以完成对部门经济的划分。
(1)二级类目的划分。第一,统计类目频次。由于专题数据库中的部门经济分类体系仅5个,样本量较少,加上宏观经济分类体系中不乏有关部门经济生产总值的类目,所以对部门经济类目频次的统计也加上宏观经济分类体系的相关内容。常见的类目有通信(10次)、交通(8次)、贸易(8次)、能源(7次)、农业(7次)、旅游(6次)、金融(6次)和工业(4次)。第二,参照行业分类国家标准中的经管类目对“部门经济”进行细分,形成农、林、牧、渔业、采矿业和制造业等15类,增设“综合性部门”,以容纳未包括在行业分类国家标准中的综合性业态,如“旅游”“工业”和“贸易”。
(2)三级类目的划分。受数据来源和数量等因素制约,专题数据库间的经济指标差异大,未形成固定的指标体系。以中经网产业数据库为参考设置三级类目。该数据库以产业经济学为基础,结合业界规范与检索需求组织数据内容,实现对产业发展及运行态势的立体、连续、深度的揭示。参照该数据库,将各部门经济按照市场供求、对外贸易、流通情况、行业绩效、行业投资、科技研发、能源消耗、居民消费和其他进行划分[17],见表5。——论文作者:司莉,刘尧,周璟