本次专利数据集涵盖超 4800 万条专利的申请与授权记录,已按年份完成拆分处理。
具体字段包括:ipzlid(专利唯一标识)、年份、申请日、专利标题、摘要、申请人、公开公告号、公开公告日、申请号、专利类型、公开国别、首项权利要求、独立权利要求、文献页数、IPC 主分类、IPC 分类、洛迦诺分类号、当前权利人。
同时包含主体属性信息,包括:申请人类型、申请人国家 / 地区、申请人地址、当前专利权人地址、工商注册地址、工商公司类型、工商成立日期、工商统一社会信用代码、工商注册号、工商上市代码、工商企业状态、发明人。
还涵盖引用与优先权相关信息,包括:引证次数、被引证次数、自引次数、他引次数、被自引次数、被他引次数、家族引证次数、家族被引证次数、优先权信息、优先权号、优先权日、授权公告号、授权公告日。

ipzlid 字段:作为每条专利的唯一标识,可直接与平台内其他含该字段的数据集进行关联匹配,实现数据跨表整合。
地理编码字段:省、省代码、市、市代码、县、县代码等字段,是基于原始数据中的省市区县信息,结合 2021 年行政区划代码标准匹配生成,确保地理信息的准确性与统一性。