上市公司数字化转型指数(2007-2024)Word2Vec扩充+TF-IDF

数据名称:A股上市公司数字化转型指数
时间跨度:2007年-2024年
数据格式:Excel表格(dta可直接导入)
包含指标:股票代码、年份、MD&A总词数、数字化转型总指数、147个细分关键词词频

数据来源与处理:
✅ 采用Word2Vec机器学习模型对种子词进行训练扩充,人工筛选,剔除“等线”“大数”等干扰词,保留“UEDA”“RAG”“大模型”等前沿词
✅ TF-IDF算法加权,分词使用自定义词典+全小写匹配,精准提取MD&A段落,非全篇统计
✅ 剔除“年报摘要”版本,防止分母过小导致指数虚高
✅ 计算逻辑严密,非简单词频求和。