主分量分析法在环境空气监测数据分析中的应用
刘得守1, 周康2, 张夏夏2, 左瑞亭2     
1. 西宁市生态环境局,青海 西宁 810001;
2. 南京雨后地软环境技术有限公司,江苏 南京 210013
摘要: 根据西宁市13个环境空气监测站点2013—2017年大气污染物细颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧最大8 h平均(O3-8h)和一氧化碳(CO)的监测数据,采用主分量分析法对西宁市环境空气质量进行了综合评估。结果表明,2013—2017年西宁市大部分环境空气监测站点周边环境空气质量逐渐提升,4个国控站综合得分(F)趋势变化幅度较大,其周边环境空气质量状况改善较为明显;城南新区、湟源县气象局和西钢监测站点周边环境空气质量呈逐年下降趋势,与其附近工业生产有关。
关键词: 主分量分析法    环境空气质量    综合评估    西宁    
Application of Principal Component Analysis in Evaluating of Ambient Air Automatic Monitoring Station
LIU De-shou1, ZHOU Kang2, ZHANG Xia-xia2, ZUO Rui-ting2     
1. Xining Ecological and Environment Bureau, Xining, Qinghai 810001, China;
2. Nanjing Star-jelly Environmental Consultant Company Limited, Nanjing, Jiangsu 210013, China
Abstract: According to the monitoring data of fine particulate matter (PM2.5), respirable particulate matter (PM10), sulfur dioxide (SO2), nitrogen dioxide (NO2), ozone up to 8 hours average (O3-8h) and carbon monoxide (CO) in Xining City from 2013 to 2017, the principal component analysis method was used to comprehensively evaluate the ambient air quality in Xining City. The results showed that the ambient air quality of most environmental air monitoring stations in Xining City has gradually increased in recent years, and the integrated score(F) trend of the 4 state controlled stations varied mostly, the ambient air quality surrounding them improved obviously. While the air quality observed in the sites of Chengnan new area, Meteorological Bureau of Huangyuan county and Xigang showed declining year by year, which was related to the industrial production nearby.
Key words: Principal component analysis    Ambience air quality    Comprehensive evaluation    Xining    

目前评价环境空气质量的方法有灰色聚类法[1-3]、综合指数评价法[4-5]、模糊综合评判法[6-8]、改进密切值法[9-11]和神经网络[12-14]等。以上方法在评价时均存在一定的不足,如模糊综合评价评判法需对每个指标人为的给定一个权数,另外由于指标数量多,难以体现主要指标的作用,同时增加了评价工作量[15]。而主分量分析法在保证原始数据信息损失最小的前提下,以少数的综合变量取代原有的多维变量,可达到评价环境空气质量的目的[16-19]

现根据西宁市13个环境空气监测站点2013—2017年大气污染物细颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3-8h)和一氧化碳(CO)的监测数据,采用主分量分析法对西宁市环境空气质量进行了综合评估。

1 研究区概况

西宁市位于青海省东北部,青藏高原东部。全市总面积7 649 km2,其中市辖区面积510 km2,平均海拔2 261 m,地理坐标东经101°77′、北纬36°62′。下辖城东区、城中区、城西区、城北区以及大通县、湟中县、湟源县。地处中纬内陆,属于大陆性高原半干旱气候,具有气压低、日照长、雨水少、太阳辐射强、日夜温差大等特点。从行业分类看,西宁市主要有5大行业:有色金属冶炼和压延加工业,电子、电力、热力生产和供应业,黑色金属冶炼和压延加工业,化学原料和化学制品制造业,医药制造业。以金属冶炼及制造业为主的工业结构,加上重工业为主的特点导致能源消耗量大,给西宁市空气环境质量进一步改善带来较大压力。近年来全市首要污染物主要是颗粒物,受冬季供暖影响,SO2、NO2、PM2.5月均值较高,在春季受沙尘天气影响ρ(PM10)较高,西宁市空气质量整体呈现“冬春季污染重,夏秋季污染轻”,且春季沙尘污染较严重的总体特征。

2 研究方法 2.1 分析方法 2.1.1 数据标准化

为了排除数量级和量纲不同带来的影响,需要对原始数据进行标准化处理,公式[20]如下。

$ Y_{i j}=\frac{X_{i j}-X_{j}}{R_{j}}(i=1, 2, \cdots, m ; j=1, 2, \cdots, n) $ (1)

式中:Xij——第i个指标类型的第j个指标的值;

XjRj——第j个指标样本的均值和标准差;

Yij——标准化后数据。

2.1.2 相关系数矩阵

利用标准化后的数据,采用SPSS19.0软件[21]进行计算得到数据相关系数矩阵。

2.1.3 数据特征值及贡献率

根据相关矩阵R的特征方程|λEp-R|=0,解得特征值λ1λ2,…λp,依据特征值λ≥1确定主成分个数mEp为标准矩阵。

2.1.4 主成分得分及综合评价

主成分载荷矩阵表示主成分Fi与原始变量Xj之间的相关关系,即原来变量Xj(j=1,2,…,n)在各主成分Fi(i=1,2,…,m)上的载荷lij(i=1,2,…,mj=1,2,…,n)。lij为第i个指标类型的第j个指标的载荷。

$ l\left(Z_{i}, X_{j}\right)=\sqrt{\lambda_{i}} a_{i j} $ (2)

式中:l——主成分载荷矩阵;

aij——主成分Fi表达式的系数;

λi——相关系数矩阵的特征值;

Zi——标准化后的矩阵;

Xj——第j个指标样本的均值。

根据各主成分在各变量上的载荷和各变量标准化后的值可以求出主成分Fi的得分,再以第n主成分的贡献率为权重,计算出综合得分。

$ F = \sum\limits_{n = 1}^n {F_n^\prime } \times {\omega _n} $ (3)

式中:F——主成分综合得分;

F′n——第n主成分得分;

ωn——第n主成分贡献率。

2.2 数据时间

2013—2017年。

2.3 数据来源

根据《西宁市2013—2017年环境质量状况公报》等资料,选取PM2.5、PM10、SO2、NO2、O3-8h和CO共6种污染物的监测数据作为评估依据。西宁市目前有4个国控站点和13个市控站点,见表 1

表 1 17个环境空气监测站点信息
序号 站点名称 所在区/县
1 市环境监测站 城西区
2 城北区政府 城北区
3 四陆医院 城东区
4 第五水厂 湟中县
5 城东区政府 城东区
6 西宁宾馆 城中区
7 海湖新区 城西区
8 城南新区 城中区
9 西钢 城西区
10 西宁市植物园 城西区
11 大通县朔山中学 大通县
12 大通县北川工业园区 大通县
13 湟中县园林所 湟中县
14 湟中县甘河西区 湟中县
15 甘河工业园管委会 湟中县
16 湟源县气象局 湟源县
17 湟源县大华工业园区 湟源县
①西宁市植物园、大通县北川工业园区、甘河工业园管委会和湟源县大华工业园区共4个监测站点由于设备尚处在初期调试中,实时监测数据未上报;1~4为国控站,5~17为市控站。

3 各监测站点数据的评估分析 3.1 市环境监测站点

2013—2017年市环境监测站点PM2.5、PM10、SO2、NO2、O3-8h和CO的日均值监测数据见表 2。计算标准化后数据的主成分特征值、贡献率和累计贡献率见表 3,因子载荷矩阵见表 4

表 2 市环境监测站点监测数据
μg/m3
年份 PM2.5 PM10 SO2 NO2 O3-8h CO
2013 65 160 57 48 67 2.1
2014 58 120 41 40 75 1.3
2015 45 95 26 42 76 1.4
2016 40 90 25 45 77 1.5
2017 38 102 24 40 103 1.4
①CO单位:mg/m3

表 3 主成分特征值及贡献率
主成分 λ w/% 累计w/%
F1 4.594 76.6 76.6
F2 0.758 12.6 89.2
F3 0.636 10.6 99.8
F4 0.011 0.19 100
F5 4.957×10-16 8.3×10-15 100
F6 -4.264×10-18 -7.1×10-17 100

表 4 因子载荷矩阵
污染物 F1
PM2.5 0.911
PM10 0.928
SO2 0.962
NO2 0.808
O3-8h -0.751
CO 0.872

表 3可见,F1λ>1,因此提取F1,除O3-8h以外,F1与PM2.5、PM10、SO2、NO2和CO年日均值成正相关,F1主要代表了该6种污染物日均值总的变化程度。各年份F1F表 5

表 5 各年份F1F及排序
年份 F1 F 排序
F1 排序
2013 6.281 5 4.809 5
2014 -0.212 4 -0.163 4
2015 -2.374 1 -1.818 1
2016 -1.967 2 -1.506 2
2017 -1.728 3 -1.323 3

表 5排序可见,F1在2013—2014年呈下降趋势,在2015—2017年呈上升趋势,2015年得分最低,说明该监测站点周边区域的污染程度在2013—2014年呈减轻趋势,在2015—2017年呈加重趋势,2015年污染程度最轻。F的大小表示大气环境空气污染程度的重轻,即F越大,大气环境污染程度越严重。从F来看,2013、2014年F呈下降趋势,在2015—2017年呈上升趋势,说明该监测站点周边近5年整体大气污染程度呈减轻趋势,但近3年来大气环境质量有所下降。

3.2 其他监测站

各监测站点F趋势变化见图 1。由图 1可见,城南新区、湟源县气象局和西钢3个监测站点周边空气污染呈逐年上升趋势,这是由于城南新区监测站点处于工业企业众多的南川工业园,湟源县气象局监测站点北侧有工厂,西钢监测站点位于西宁特种钢铁厂区内,与其监测站点周边工业生产活动有关,后续应加强相应企业的排污管理;其余监测站点虽有小幅波动,但总体呈下降趋势,说明近些年西宁市整体大气污染状况得到改善,环境空气质量有所提升;西宁市2013—2017年各污染物年均值汇总见表 6。由表 6可见,各污染物年均值呈逐年下降趋势。

图 1 各监测站点F趋势变化

表 6 2013—2017年各污染物年均值汇总
μg/m3
年份 SO2 NO2 CO O3-8h PM2.5 PM10
2013 48 41 1.8 84 70 163
2014 41 38 1.3 60 63 120
2015 31 38 1.4 81 49 106
2016 31 42 1.4 80 49 113
2017 24 40 1.4 92 39 100
①CO单位:mg/m3

4 结论

(1) 2013—2017年西宁市整体环境空气质量有所提升;

(2) 4个国控站F趋势变化幅度较大,其周边环境空气质量状况改善较为明显;

(3) 城南新区、湟源县气象局和西钢监测站点周边环境空气质量呈逐年下降趋势,与其附近工业生产有关。

参考文献
[1]
胡军, 许丽忠, 张江山. 基于改进灰色聚类法的大气环境质量综合评价[J]. 福建师大学报(自然科学版), 2012, 28(1): 49-54.
[2]
麻冰涓, 贺添. 基于改进的灰色聚类法的大气环境质量评价方法的研究[J]. 环境研究与监测, 2008(3): 51-54.
[3]
朱庆峰, 张淑娟. 灰色聚类法在大气环境质量评价中的应用[J]. 广州环境科学, 2004(2): 41-44.
[4]
吉祝美. 新《环境空气质量标准》下的环境空气质量评价方法探讨[J]. 污染防治技术, 2014(3): 47-50.
[5]
普映娟, 王琳邦. 环境空气质量综合指数评价方法探讨[J]. 环境科学导刊, 2010, 29(2): 93-94. DOI:10.3969/j.issn.1673-9655.2010.02.027
[6]
肖继先. 应用模糊综合评价级数评价大气环境质量[J]. 环境工程, 1994(6): 46-49.
[7]
马媛媛, 孙世群. 模糊综合评价在合肥市大气环境评价中的应用[J]. 环境科学与管理, 2012, 37(5): 188-191. DOI:10.3969/j.issn.1673-1212.2012.05.048
[8]
吴新国, 王杰, 彭书时, 等. 武汉市2001~2005年大气环境质量模糊综合评价[J]. 环境科学与技术, 2007, 30(10): 58-59. DOI:10.3969/j.issn.1003-6504.2007.10.022
[9]
许丽忠, 张江山. 改进密切值法优化大气环境监测布点[J]. 环境工程, 2000, 18(2): 50-53. DOI:10.3969/j.issn.1000-8942.2000.02.017
[10]
许剑海, 张江山, 陈庆华, 等. 改进密切值法及其在大气环境质量评价中的应用[J]. 环境科学与管理, 2008, 33(10): 188-191. DOI:10.3969/j.issn.1673-1212.2008.10.052
[11]
杨红玉, 张江山. 改进密切值法在环境综合评价中的应用[J]. 环境科学与技术, 2005, 28(s1): 112-113.
[12]
杨文东, 程洪斌. 神经网络在大气环境质量评价中的应用研究[J]. 工业安全与环保, 2001, 27(9): 31-33. DOI:10.3969/j.issn.1001-425X.2001.09.011
[13]
王红芳, 康慕宁, 邓正宏. BP神经网络在大气环境质量评价中的应用研究[J]. 科学技术与工程, 2009, 9(7): 1997-2000. DOI:10.3969/j.issn.1671-1815.2009.07.079
[14]
张虹冕, 孙世群. 基于BP神经网络的大气环境质量评价模型[J]. 安徽农业科学, 2010, 38(31): 17656-17657. DOI:10.3969/j.issn.0517-6611.2010.31.113
[15]
冯利华. 环境质量的主成分分析[J]. 数学的实践与认识, 2003, 33(8): 32-35. DOI:10.3969/j.issn.1000-0984.2003.08.006
[16]
王丹, 倪长健. 主成分分析法在大气环境质量评价中的应用[J]. 平顶山学院学报, 2011, 26(2): 112-115. DOI:10.3969/j.issn.1673-1670.2011.02.027
[17]
姜新华, 薛河儒, 张存厚, 等. 基于主成分分析的呼和浩特市空气质量影响因素研究[J]. 安全与环境工程, 2016, 23(1): 75-79.
[18]
解素雯, 孟昭为. 淄博市2014年大气环境质量综合评价——基于主成分分析法[J]. 现代商贸工业, 2015, 36(11): 27-28. DOI:10.3969/j.issn.1672-3198.2015.11.012
[19]
黄玉平, 张庆国, 汪水兵, 等. 主成分分析在大气质量监测优化布点中的应用[J]. 安徽农业大学学报, 2011, 38(6): 966-969.
[20]
薛燕芝, 刘选卫, 易文利, 等. 主成分分析法在大气环境质量评价中的应用——以陕西省铜川市为例[J]. 河南科学, 2016, 34(8): 1307-1311.
[21]
时立文. SPSS 19.0统计分析从入门到精通[M]. 北京: 清华大学出版社, 2012.