以各城市政府工作报告文本为基础,参考了刘文革等(2024)《数“政”强贸:数字化政府建设 与中国出口产品质量升级》的计算方法:1.参考文章附录关键词典;2.采用词频-逆文本频率(Term Frequency Inverse Document Frequency,TF-IDF)方法进行测算。

TF-IDF 计算公式:

ln[tfct (θ) + 1]表示城市 c 在第 t 年公布的《政府工作报告》中包含的关键词 θ 的统计词频 (Term Frequency,TF),
ln [ CG cgt (θ) + 1 ] :为 对 应 关键词 θ 的逆文本频率(Inverse Document Frequency,IDF),
CGt 和 cgt  (θ) :分别代表在第t年样本中的《政府工作报告》文本总量以及包含关键词 θ 的文本总量。

参考文献:[1]刘文革,耿景珠,杜明威.数“政”强贸:数字化政府建设与中国出口产品质量升级[J].数量经济技术经济研究,2024,41(06):67-87.