数据来源:政府工作报告
时间跨度:2005-2024
区域跨度:300个城市
数据格式:面板数据
以全国 300 个城市 2005-2024 年的政府工作报告为初始样本,针对政策倾向、引进类型、引进服务、引进方式四类关键词开展爬取工作,最终获取各类关键词的出现频数。
该数据库包含普通版与稳健版两个版本。为规避检索范围过宽可能引发的偏差,稳健版做出两项调整:一是将强调性词汇的检索范围进一步缩小至目标词前后 10 个字符内,二是取消对关键词的权重处理环节。
在权重设定规则上,将 “深化、深入、大力、确保、扎实” 等关键词的权数设定为 1.5,将 “进一步、继续、持续扩大” 等关键词的权数设定为 1.2。后续通过对各关键词的加权频数进行加总计算,得到最终的加权关键词数。
人才引进强度=加权关键词数/报告总词数



