专利引用网络是衡量技术创新关联与传播的重要载体,本次推出的中国全部专利互引网络核心指标数据,为创新研究提供了精准的量化支撑。这份基于海量专利引用数据计算的成果,通过度中心性与 PageRank 两大核心指标,清晰勾勒出四十年来技术网络的结构与关键节点特征。

1.数据计算背景与核心方法:
这份核心指标数据并非简单统计,而是基于 1990-2024 年中国全部专利引用与被引用详细信息,通过 R 语言 tidygraph 包深度运算得出。由于专利数据体量庞大(最终样本量达 2529 万余条),本次重点计算了两类核心中心性指标,兼顾数据准确性与运算效率。
运算工具选择:选用 tidygraph 包中成熟的 centrality_degree () 与 centrality_pagerank () 函数,前者适配有向网络的度中心性计算,后者采用谷歌经典 PageRank 算法,可精准衡量节点重要性。
数据处理特点:针对专利引用的有向网络属性,度中心性计算采用 “总度数” 模式,即同时统计节点的入度(被引用次数)与出度(引用其他专利次数),全面反映专利的技术关联强度。

2.两大核心指标:定义与创新价值:
(1) 度中心性(centrality_degree)
作为网络分析的基础指标,度中心性直接反映单个专利节点的直接连接数量。在有向专利网络中,该指标可细分为入度、出度与总度数,本次数据统一采用总度数统计,核心价值在于快速识别技术网络中的 “枢纽专利”—— 这类专利往往通过高频引用与被引用,成为连接不同技术分支的关键节点。其计算公式基于邻接矩阵,通过统计节点间连接关系得出量化结果。
(2) PageRank 中心性(centrality_pagerank)
相较于度中心性的 “数量导向”,PageRank 中心性更侧重 “质量加权”,由谷歌创始人提出的经典算法优化而来。其核心逻辑是:一个专利的重要性不仅取决于引用它的专利数量,更取决于这些引用专利本身的影响力(高 PageRank 值专利的引用权重更高)。通过随机游走模型模拟技术传播路径,有效规避了简单入度统计中 “所有引用等同” 的缺陷,更适合识别技术领域内的核心引领性专利。