2203 上市公司间技术流动数据(2006-2025)

关键字:上市公司间技术流动数据(2006-2025) 发布时间:2026-01-07 查看更多详细信息
数据来源 .
时间跨度 .
区域跨度 .
数据格式 excel形式
数据简介

上市公司专利引用对数据是刻画客户公司间技术信息流动轨迹与强度的核心载体,其精准度直接决定对专利引用技术溢出企业绩效等相关传导机制的实证检验效果。该数据聚焦于量化企业间基于专利引用形成的技术关联程度,通过专利引用关系识别与样本筛选相结合的方式,构建能够反映引用公司被引公司技术信息流动强度的度量指标,为揭示企业间技术扩散规律、探究技术信息流动的经济后果及完善技术创新相关监管政策提供关键数据支撑,适用于学术研究、企业技术战略研判及相关政策制定等多元场景。

本数据核心来源为CNPD008 -- 中国上市公司及子、联营公司专利数据库。数据构建以专利引用关系为核心,通过识别引用公司被引公司的配对关系,提取公司(i 引用公司)在 t 年申请的专利对公司(j 被引公司)专利的引用次数(Citations)作为核心代理指标,同时配套收集引用公司与被引公司的基本信息及相关财务特征数据,为实证研究中的模型构建与控制变量设置提供数据支撑。

本文CNPD008 -- 中国上市公司专利数据库中存在引用关系的上市公司为初始样本,构建专利引用变量(`Citations`)的具体步骤如下:

首先,读取上市公司专利申请数据 `patents_of_listed_firms`,此为我司团队清洗整理干净的上市公司专利面板数据,依据 `'申请公布号'` 字段去除重复记录和去除空值,(对应论文剔除了上市公司专利申请数量为零的上市公司)以确保专利样本的唯一性。其次,对 `'被引证申请人'` 字段进行清洗,利用正则表达式拆分单条记录中包含的多个被引对象,并通过 `explode` 操作将数据行“炸裂”,生成包含 `'被引证申请人公司名称'` 的引用明细数据,筛选出`'被引证申请人'`的上市公司数据。接着,引入上市公司名录,通过 `'被引证申请人公司名称'` 匹配被引方的 `'股票代码_引证'`(即 `'股票代码_被引证'`),仅保留 `'年份'` 处于 2006 2025 年间的有效样本,并根据 `'股票代码'` `'股票代码_被引证'` 是否相同来剔除自引数据。最后,依据 `'股票代码'``'年份'``'公司名称'` 以及 `'被引证申请人公司名称'` 等字段进行分组聚合(`groupby`),使用 `size()` 方法统计每组内的记录数量,从而得到衡量公司对之间年度技术流动强度的指标 `'Citations'`

最终得到179317公司对”—年度观测值,对应4668引用公司4704被引公司105051公司对,完整呈现2006-2025年各上市公司配对间专利引用的核心度量结果。

创新之处在于以上数据处理步骤,使得数据不包含引用数为0的公司对!


数据指标

股票代码

年份

公司简称

公司名称

股票代码_被引证

公司简称_被引证

被引证申请人公司名称

Citations



数据展示

image.png

参考文献

[1]叶艳婷,吴世农,吴益兵.共享保荐人、公司间技术信息传递与技术创新[J].管理世界,2025,41(01):187-