为解决税收调查数据中企业统一社会信用代码等基础信息的缺失问题,本研究以2016年的完整企业数据为基准,借助企业关键指标匹配法逆向推导2017-2020年的企业基础信息,最终构建起2016-2020年的平衡面板数据集。

该数据集不仅涵盖企业基础信息,还纳入了依据企业煤炭、石油及天然气等能源消耗量测算得出的碳排放数据。从样本规模来看,数据集整体包含227.5175万条记录,其中可用于分析的碳排放有效样本约134万条。在时间维度上,2016至2020年各年度数据量稳定保持在45.5035万条,呈现出优异的时间序列平衡性。