您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[Nature]:利用公共大数据分析韩国空气污染与结膜炎患病率的相关性 - 发现报告
当前位置:首页/行业研究/报告详情/

利用公共大数据分析韩国空气污染与结膜炎患病率的相关性

信息技术2022-06-16Nature无***
利用公共大数据分析韩国空气污染与结膜炎患病率的相关性

科学报告|(2022) 12:10091| https://doi.org/10.1038/s41598-022-13344-51 打开空气污染之间的相关性使用公共大数据分析韩国结膜炎和流行情况Sanghyu Nam1,4, Mi Young Shin2,3,4, Jung Yeob Han1, Su Young Moon1, Jae Yong Kim1, Hungwon Tchah1 & Hun Lee1这项研究利用韩国的公共大数据调查了天气因素的变化如何影响结膜炎的流行。 2013 年 1 月至 2019 年 12 月共收集到 1,428 条公共大数据条目。从国家提供的大数据中收集疾病数据和基本的气候/空气污染物浓度记录。使用多元线性回归和机器学习分析方法,如极端梯度增强(XGBoost)、决策树和随机森林,确定影响眼部疾病的气象因素。使用均方根误差 (RMSE) 值时,性能最佳的预测模型是 XGBoost (1.180),其次是多元回归 (1.195)、随机森林 (1.206) 和决策树 (1.544)。使用 XGBoost 模型,省是最重要的变量 (0.352),其次是月份 (0.289) 和一氧化碳暴露 (0.133)。包括二氧化硫、PM10、二氧化氮和臭氧在内的其他空气污染物与结膜炎的相关性较低。我们使用传统的多元回归分析和机器学习技术确定了与结膜炎相关的因素。区域因素对结膜炎的流行以及大气和空气质量因素都很重要。结膜炎是眼科诊所常见的疾病,主要由病毒感染、过敏反应或特应性引起。环境因素也与结膜炎的发病率有关1.与眼睛中的眼表持续接触会使毒素直接进入眼部结构并引起结膜炎样症状2.此外,环境污染对人类健康的影响可能因暴露于空气污染物的成分、程度和时间而异3.以前的研究集中在评估空气污染与呼吸器官和心血管血管相关的健康问题之间的关系5.然而,空气质量不仅会影响呼吸系统和心血管系统,还会影响与空气直接接触的眼睛表面。臭氧、二氧化氮和二氧化硫等空气污染物与结膜炎有关7.此外,一项研究发现空气动力学直径 < 10 μm (PM10) 的颗粒物水平与韩国角膜结膜炎、缺血性心脏病和中风的急诊就诊之间存在关系8.对于结膜炎的医疗保健,需要开展角膜结膜炎等眼表疾病的患病率研究,报告结膜炎的患病率与空气和大气质量的关系,以及地区、人数、年龄和性别。然而,目前还没有全国性的研究评估各种空气污染物与结膜炎之间的关系。因此,在本研究中,我们利用韩国各政府机构提供的公共大数据,调查了天气和人口因素的变化如何影响结膜炎的患病率。此外,我们通过使用机器学习流行率预测模型确定了空气污染是否会增加结膜炎的风险。1韩国首尔蔚山大学医学院牙山医学中心眼科。 2韩国天主教大学公共卫生研究生院,韩国首尔。 3首尔市教育厅,韩国首尔。 4这些作者的贡献相同:Sanghyu Nam 和 Mi Young Shin。邮箱:yhun777@gmail.com 科学报告|(2022) 12:10091 |https://doi.org/10.1038/s41598-022-13344-52图1。结膜炎的流行。 (一个) 按年份划分的结膜炎患病率(每 1,000 人中的患者人数)。患者人数从 2013 年到 2019 年有所增加。(b) 每个省的流行率。结果从年度流行趋势看,2019年每千人有19.17人结膜炎确诊,而2013年每千人有17.47人结膜炎。2013年至2019年每年患者人数呈上升趋势,2015年和2019年略有下降(图 1a)。各省患病率也呈稳步上升曲线。在一些地区,2015 年流行率有所下降,但从 2016 年开始再次上升(图 1b)。图 2 显示了韩国各地区按月划分的结膜炎患病率和天气参数。所有省份结膜炎的月度患病率在 5 月和 9 月达到峰值(图 2a)。随着冬季变为夏季,季节之间出现高峰,患病率趋于增加。平均气温在 7 月和 8 月最高,在 1 月和 2 月最低(图 2b)。所有地区的平均温度都呈现出相似的趋势。春秋两季日温差最大,但济州岛、釜山市和仁川市等部分省份由于是沿海地区,温差较小(图2c)。月平均风速变化不大;仅在济州岛的冬季,与其他省份相比,观察到的风速相对较高(图 2d)。图 3 显示了按地区划分的每月空气质量数据。在所有省份,PM10 水平从冬季到春季保持较高水平,5 月开始下降,8 月最低,9 月至春季再次上升至较高水平(图 3a)。其他空气质量变量,包括二氧化氮、一氧化碳和二氧化硫的浓度,在夏季表现出低水平,在冬季表现出高水平(图 3b-d)。二氧化硫水平在蔚山市尤为独特,夏季最高(图3d)。这个结果可能是因为蔚山市的工业化程度很高。臭氧浓度在春季最高,在所有省份从夏季到冬季逐渐降低(图3e)。进行 Pearson 相关系数分析以评估结膜炎患病率与自变量之间的关系(表 1)。结果显示与平均温度、湿度、降水和臭氧浓度呈正相关;描述了每日温差、平均风速和二氧化硫、二氧化氮、一氧化碳和 PM10 浓度的负相关。在多元回归分析中,决定系数为0.8789。基于多元回归分析的高预测能力,我们评估了极端梯度提升(XGBoost)、决策树和随机森林等机器学习技术中性能最佳的流行预测模型。均方根误差 (RMSE),训练集和测试集的比例为 9:1。结果,模型性能按 XGBoost (1.180)、多元回归 (1.195)、随机森林 (1.206) 和决策树 (1.544) 的顺序显示(表 2)。根据显示机器学习预测中真实值和预测值之间差异的散点图,XGBoost 的预测最适合真实值。决策树在其他模型中的拟合度最低,与之前的研究相似(图 4)9.根据预测能力最好的 XGBoost 预测模型的结果,最重要的变量是省份(增益值:0.352)、月份(0.289)和一氧化碳水平(0.133;表 3)。 科学报告|(2022) 12:10091 |https://doi.org/10.1038/s41598-022-13344-53图 2。每个地区按月划分的结膜炎患病率和天气参数。 (一个) 结膜炎的患病率,(b) 平均温度, (C) 平均日温差,和 (d) 平均风速。讨论在本研究中,基于全国公共大数据,我们评估了天气和空气质量变量对结膜炎患病率的影响,并比较了预测模型的性能。此前已有关于空气污染与各种疾病之间相关性的研究,如角膜结膜炎、缺血性心脏病、中风和呼吸系统疾病8.尽管有各种与眼部疾病相关的数据集,但众所周知,包括角膜在内的眼表总是暴露在空气中,因此结膜炎的症状和空气污染物总是相关联的。11.因此,在本研究中,我们选择了角膜结膜炎、结膜炎和睑结膜炎等眼表疾病,分析其与环境因素的关系。2013-2019年结膜炎患病率呈上升趋势。按月度分析,患病率以春季和秋季最高,5月和9月两个高峰,冬季最低。这一发现与之前的研究结果一致12,在此期间,过敏性结膜炎的患病率从春季到秋季随着其他过敏原水平的增加而增加,例如灰尘和花粉。在预测模型中,XGBoost 模型表现出最好的性能,其次是多元回归分析、随机森林和决策树建模。根据 XGBoost 模型,最重要的变量是省份,其次是月份和一氧化碳水平。值得注意的是,在之前在韩国进行的一项研究中,地区并未被估计为有效因素8.这种差异可能归因于每个省的不同气候因素、空气质量因素和医疗系统。我们认为,进一步研究区域预测模型是必要的。第二个最重要的因素是一年中的月份。如前所述,流行率因月而异,春季和秋季发病率较高。值得注意的是,每月的影响大于其他气候或空气质量因素的影响。这些气候和空气质量因素综合反映在每个月的周期中。因此,以月份为唯一因素,与其他气候和空气质量因素相比,它可能是最重要的,因为它可以预测气候和空气质量本身的特征。在空气污染物中,与二氧化硫 (0.016)、PM10 (0.017)、二氧化氮 (0.013) 和臭氧 (0.019) 的相关性相比,一氧化碳与结膜炎的患病率 (0.133) 的相关性最高。先前的一些研究表明,一氧化碳对结膜炎的患病率影响很小。一份报告显示一氧化碳水平与哮喘急诊就诊之间存在关联10,另一个报告一氧化碳水平与结膜炎的患病率之间存在正相关关系13.相比之下,Chang 等人。报道一氧化碳对门诊就诊的非特异性结膜炎病例没有显着影响,因为一氧化碳暴露不会引起眼部刺激14.根据我们的研究,结膜炎和一氧化碳呈负相关,据我们所知,这是唯一显示负相关结果的研究。我们认为,一氧化碳水平的增加与寒冷季节使用燃料取暖密切相关。一氧化碳的浓度在夏季降低,在冬季增加。我们的结果表明,一氧化碳的浓度从 4 月到 9 月保持在低水平,然后从 科学报告|(2022) 12:10091 |https://doi.org/10.1038/s41598-022-13344-54图 3。各地区按月划分的空气质量参数。 (一个) 二氧化硫浓度, (b) 二氧化氮浓度, (C) 一氧化碳浓度, (d) PM10 浓度,和 (e) 臭氧浓度。12345678910111. 地区流行率0.52-0.110.130.290.04-0.28-0.370.43-0.56-0.262.温度0.52-0.260.610.61-0.07-0.33-0.640.54-0.74-0.583.每日温差-0.11-0.26-0.50-0.43-0.45-0.010.220.160.230.484. 湿度0.130.61-0.500.59-0.16-0.27-0.550.05-0.39-0.585. 降水0.290.61-0.430.590.01-0.25-0.490.21-0.48-0.496.风速0.04-0.07-0.45-0.160.010.25-0.040.21-0.130.077. SO2-0.28-0.33-0.01-0.27-0.250.250.51-0.180.500.438. NO2-0.37-0.640.22-0.55-0.49-0.040.51-0.550.670.559. O30.430.540.160.050.210.21-0.18-0.55-0.550.0010. 一氧化碳-0.56-0.740.23-0.39-0.48-0.130.500.67-0.550.5311. PM10-0.26-0.580.48-0.58-0.490.070.430.550.000.53表格1。使用流行率与温度或空气质量参数之间的相关性分析变量的相关系数。平均气温、湿度、降水量与臭氧呈正相关,日温差、平均风速、二氧化硫、二氧化氮、一氧化碳和PM10呈负相关。 SO2、二氧化硫; NO2,二氧化氮; O3,臭氧; CO,一氧化碳; PM10,空气动力学直径 < 10 μm 的颗粒物水平。重要值以粗体显示。 科学报告|(2022) 12:10091 |https://doi.org/10.1038/s41598-022-13344-55模型均方根误差多元线性回归1.195XGBoost1.180随机森林1.206决策树1.544表 2。均方根误差值建模技术的比较。 RMSE,均方根误差。图 4。每个模型的预测流行率与实际流行率。 XGBoost 模型显示了最准确的预测模型,而决策树模型显示了最不准确的预测。多变的获得省(地方)0.352月0.289一氧化碳0.133温度0.060湿度0.030风速0.030沉淀0.022温度波动0.021O30.019PM100.017二氧化硫0.016NO20.013表3。XGBoost 预测模型中的重要变量。 CO,一氧化碳; O3,臭氧; PM10,空气动力学直径 < 10 μm 的颗粒物水平; SO2、二氧化硫; NO2,二氧化氮。 科学报告|(2022) 12:10091 |https://doi.org/10.1038/s41598-022-13344-56十月至三月。结膜炎的患病率在 4 月开始增加,在 5 月和 9 月达到高峰,从 10 月到 3 月下降。这种变化被认为是每月趋