2124 企业大数据运用-基于MD&A的文本分析2010-2024

关键字:大数据 发布时间:2025-10-21 查看更多详细信息
数据来源 .
时间跨度 .
区域跨度 .
数据格式 数据格式为Excel形式
数据简介

在数字经济深度融合实体经济、产业智能化转型加速推进的背景下,上市公司作为市场主体的核心力量,其人工智能技术应用、研发投入及成果转化情况,既是企业构筑核心竞争力的关键要素,也是反映产业数字化升级水平的重要依据。该上市公司人工智能发展指标数据,可有效支撑人工智能对企业绩效提升、创新能力培育及转型路径优化的相关研究,为政策制定者精准出台上市公司智能化扶持政策、企业制定人工智能发展战略提供数据基础,弥补了上市公司层面人工智能专项指标系统梳理的研究缺口。

本指标数据来源于各上市公司官网公开披露的年度报告对年报里“管理层讨论与分析”板块的文本内容进行分析,数据层级为上市公司级;通过对2010-2024年期间上市公司公开信息的系统整理与核验,最终获得2010-2024年共计47327条上市公司人工智能发展相关指标数据,

本次数据处理流程为:首先从`result/上市公司词频统计.xlsx`(全量数据,论文所用的pdftotxt方法在将年报PDF版本转为TXT文档时,偶有PDF因版本加密等原因导致转换TXT时会出现不可逆转的偏差,故我们提供全量板,也提供初步修改的版本即DATA读取数据;将`年份`列强制转换为数值类型并剔除无法转换的无效行;基于质量控制筛除`总词数`小于等于2000的记录,并进一步仅保留`年份`小于等于2024的数据;计算每条记录的`BigData`指标(`kw_sum``总词数`的比值并乘以100,单位为百分比),随后输出数据的示例、结构信息与描述性统计以便快速检查;在存在`年份`列的前提下,按`年份`分组计算各数值字段的年度均值用于年度对比分析;最后将清洗与计算后的结果保存至`result/DATA.xlsx`以供后续使用。


数据指标

股票代码

年份

kw_sum

总词数

大数据

海量数据

算力

数据中心

信息资产

数据化

BigData



数据展示

image.png

参考文献

1】武琼,柳扬,谢雁翔,.大数据、有限信息与企业并购[J].系统管理学报,2024,33(03):824-839.