1641 中国工业环境数据库(1998-2015)

关键字:中国工业环境数据库 发布时间:2024-09-05 查看更多详细信息
数据来源 数据来自历年《中国环境统计年鉴》(2001年至2015年)和《中国环境年鉴》(1998年至2000年),数据由数据皮皮侠团队人工整理,全部内容真实有效。
时间跨度 1998-2015
区域跨度 中国省级层面数据
数据格式 excel
数据简介

参考文章China industrial environmental database 1998–2015(2022)的做法,该文章的核心数据计算方法主要通过自下而上(bottom-up)和自上而下(top-down)的方法相结合,再利用交叉熵方法来平衡每年的二维数据,最终构建了中国工业环境数据库(CIED)。

第一步,利用企业层面的环境数据计算每个地区和每个部门的污染物排放和去除量

自下而上的方法(Bottom-Up Method)

数据来自中国环境统计数据库(CESD),这个数据库是由中国环境保护部(现为生态环境部)编制的,包含了主要的工业排放源数据

使用工业企业层面数据来计算各地区和各部门的污染物排放和去除量(化学需氧量(COD)、二氧化硫(SO2)、氨氮(NH3N)和氮氧化物(NOₓ))。

在数据清洗过程中,针对异常数据记录(如缺失值和测量误差)进行了人工检查和修正。  

缺失值处理:如果一个水污染企业在所有年份都有COD和NH₃-N排放数据,但某一年缺失NH₃-N数据,那么就使用插值法来补全缺失的数据。  

测量误差修正:如果企业报告的数据使用了错误的单位(使用克而不是千克),导致数据比真实值高1000倍,那么就会将数据调整到合理的水平。

1.数据聚合

计算各地区和各部门的污染物排放和去除量是通过将所有企业的排放和去除数据进行加总得出的。具体公式如下:

image.png


2.缺失数据估算:

image.png

第二步,利用自上而下的方法收集每个地区或每个部门的污染物总排放量和去除量。

自上而下的方法(Top-Down Method)

数据来自《中国环境统计年鉴》和《中国环境年鉴》,这些年鉴中的数据是基于中国环境统计系统(ESS)编制的。

1. 宏观数据的收集:

从《中国环境统计年鉴》(2001年至2015年)和《中国环境年鉴》(1998年至2000年)中收集地区或部门的污染物排放和去除总量数据;年鉴数据是基于微观环境统计数据(CESD)汇总的,通常只包括主要污染源的数据。

2. 数据不一致处理:

环境统计系统(ESS)在研究期间经历了四次调整,这导致不同时期的数据包含不同的污染物(如NH3N和NOₓ在不同的五年计划中开始被纳入统计)以及不同的部门分类方式不同。在2003至2010年期间,火电厂的统计数据单独收集,因此这部分数据不包含在数据库中。

第三步,采用交叉熵方法来平衡每年的二维矩阵

数据平衡与调整(Cross-Entropy Method)

使用自下而上的微观环境数据(企业级数据聚合)和自上而下的宏观环境数据(年鉴数据)。

计算步骤:

1. 第一步调整(基于区域的比例调整)

image.png

2. 第二步调整(交叉熵方法平衡二维数据矩阵)

image.png

最后一步,数据验证与比较

将构建的数据库数据与浙江省的部门级环境数据进行比较,以验证数据的准确性。结果显示,构建的数据与官方统计数据高度一致,证明了其可靠性。

与国家汇总数据的比较显示,修正后的数据更为平滑,异常值得到了校正。


数据指标

cod_discharge

cod_removal

so2_discharge

so2_removal

nh3n_discharge

nh3n_removal

nox_discharge

nox_removal


数据展示

图4.部分数据展示


参考文献

Qian, H., Ren, F., Gong, Y., Ma, R., Wei, W., & Wu, L. (2022). China industrial environmental database 1998–2015. Scientific Data, 9(1), 259.