本研究参考相关文献,从多维度筛选出 113 个用于衡量企业绿色化转型的关键词。通过 Python 文本分析工具(采用 jieba 分词技术)对上市企业年报文本进行处理,统计各关键词在年报中的出现频次,形成绿色化转型词频数据。进一步对词频数据进行对数化处理(具体方法为词频数加 1 后取自然对数),以此构建企业绿色化转型指标。原始数据经 Python 初步处理后,利用 Stata 软件进行整理和结构化处理,最终形成面板数据格式,为后续实证分析提供标准化数据集。
本研究参考相关文献,从多维度筛选出 113 个用于衡量企业绿色化转型的关键词。通过 Python 文本分析工具(采用 jieba 分词技术)对上市企业年报文本进行处理,统计各关键词在年报中的出现频次,形成绿色化转型词频数据。进一步对词频数据进行对数化处理(具体方法为词频数加 1 后取自然对数),以此构建企业绿色化转型指标。原始数据经 Python 初步处理后,利用 Stata 软件进行整理和结构化处理,最终形成面板数据格式,为后续实证分析提供标准化数据集。