上市公司数实产业技术融合(2007-2024)
原始数据+计算结果+Python代码+两个稳健性替代指标计算结果

参考文献:[1]黄先海,高亚兴.数实产业技术融合与企业全要素生产率——基于中国企业专利信息的研究[J].中国工业经济,2023,(11):118-136.
指标定义:一项发明专利若满足:其IPC主分类属于实体产业技术(即非数字产业技术),且其引用的专利中至少有一项被识别为数字产业技术,则将该专利视为企业的一次“数实产业技术融合”事件。按“企业(股票代码)-申请年份”归并符合条件的专利数量,加1后取自然对数,得到年度融合指标。

核心计算流程
1. 数字产业技术IPC识别规则的构建
依据国家知识产权局2023年3月发布的《数字经济核心产业分类与国际专利分类参照关系表(2023)》,该参照表涵盖数字经济核心产业的4个大类(01数字产品制造业、02数字产品服务业、03数字技术应用业、04数字要素驱动业)、15个中类和86个小类。从中提取642条IPC匹配规则,其中372条为通配符前缀匹配(如G06F17*表示G06F17及其所有下位分类),270条为精确匹配(如G05B19/418)。判定逻辑:任一IPC分类号若与参照表中的精确代码完全一致,或以某通配符前缀开头,则认定其属于数字产业技术。
2. 数据预处理
原始数据来自企业发明专利引用明细,包含专利公开号、IPC主分类号、IPC分类号、引用专利IPC主分类号、引用专利IPC号等字段。对于一条专利对应多个关联企业(以“、”分隔)的情形,按关联企业名称、关联股票代码及与上市公司关系逐一拆分。样本筛选条件为:“与上市公司关系”取“上市公司本身”,且专利类型限定为“发明专利”。若IPC主分类号缺失,则从该专利的IPC分类号中提取第一个进行填补;引用专利IPC主分类号缺失时做同样处理。
3. 数字产业技术识别
利用第一步的匹配规则,分别判定:(1)每项专利自身的IPC主分类是否属于数字产业技术;(2)每条引用记录的引用IPC主分类是否属于数字产业技术。
4. 数实产业技术融合判定
同时满足以下两项条件,即认定为一次融合事件:
-
条件一:该专利的IPC主分类属于非数字产业技术(实体产业技术);
-
条件二:该专利所引用的专利中,至少有一项的引用IPC主分类被判定为数字产业技术。
去重处理:以专利公开号为唯一标识,同一项专利在同一企业-年份内仅计一次;若一项专利分属多个申请主体,则分别计入各主体对应年份的计数。
5. 汇总与指标计算
按股票代码和申请年份,统计满足融合条件的唯一专利公开号数量,得到“数实产业技术融合次数”。最终指标 TechConv = ln(融合次数 + 1),加1处理零值,取对数以缓解右偏分布。
面板数据补零策略
-
策略一:在各企业拥有专利的活跃年份区间内,对未发生融合行为的年份补零,该处理对应代码
Techconv_v1.py,结果文件为数实产业技术融合_TechConv_v1.xlsx,观测值共 48,647 条。 -
策略二:在整个样本区间(2007—2024年)内,对所有企业未发生融合行为的年份补零,对应代码
Techconv.py,结果文件为数实产业技术融合_TechConv.xlsx,观测值共 84,330 条。
稳健性替代指标
-
替代指标一:数实产业融合技术(FusiTech)
从创新产出视角度量,不依赖引用信息,而是依据专利自身的IPC分类构成。若专利的IPC主分类属于实体产业技术,且该专利的其他IPC分类号中至少有一项在任意层级被识别为数字产业技术,则将其定义为一项数实产业融合技术。 -
替代指标二:三年窗口期调整
为排除专利审查员添加的陈旧引用,仅保留发明人自主引用的信息。具体做法是:只统计企业专利申请时所引用的、公开时间在前三年内的专利,并基于此重新计算数实产业技术融合数量。



