数据匹配逻辑:
核心是将税收调查数据与上市公司工商注册信息进行关联,主要采用了两种严谨的匹配策略:
1.企业名称精确匹配:作为首选方法。为提高成功率,程序在匹配前会标准化处理企业名称,剔除如“有限公司”、“责任公司”等非核心词汇以及行政区划名称。
2.组织机构代码补充匹配:对于通过名称未能成功匹配的记录,系统会使用组织机构代码进行第二轮匹配,确保尽可能覆盖更多企业。
数据集本身主要包含用于识别企业的关键变量(如sdid、企业名称、法人代码等)。大家可根据这些ID,将自己需要的具体税收变量从庞大的原始税调数据中筛选出来,再与此数据集合并,从而构建定制化的研究面板数据。数据提供方还展示了匹配到的上市公司在全国的地理分布图,有助于进行区域性的经济分析。


