
参考文献:数字技术应用对企业双元创新的影响——基于组织生命周期的实证检验
样本容量:61605
数据处理:已剔除ST/PT等财务异常的样本
数据格式:仅提供dta
对上市公司年报展开文本分析,是衡量企业对特定战略重视程度的有效手段。一般而言,某类战略相关关键词在年报中的出现频次越高,往往意味着企业在该战略领域投入的关注度与资源力度越大。基于此,对年报进行文本挖掘与词频统计,成为刻画企业数字技术应用水平的切实可行路径,具体实施步骤如下:
首先,数据搜集层面,通过上海证券交易所与深圳证券交易所官方平台,系统搜集样本上市公司 2003-2024 年度的年报文本,并完成数据清洗与整理,确保年报信息的完整性与可用性,为后续分析奠定基础。
其次,关键词体系构建环节,组建涵盖企业实务专家、高校科研学者及政府主管部门人员的专业团队,通过多轮研讨、咨询与论证,最终确定用于表征企业数字技术应用的关键词词汇表。该词汇表共包含 20 个核心术语,具体为:信息化、网络化、数字化、智能化、智慧化、信息技术、数字技术、互联网、物联网、云计算、大数据、人工智能、数字资源、数字资产、电子商务、虚拟社区、智慧制造、智能制造、数字平台、数字转型。
最后,量化分析实施阶段,运用 Python 编程语言搭建文本分析模型,对整理后的上市公司年报进行深度处理,精准统计上述 20 个关键词在各企业年报中的出现频次,并将该词频数据作为衡量企业数字技术应用水平的代理指标,实现对企业数字技术应用程度的量化表征。


