您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [TIPDM]:第三届挑战赛C3-城市供水处理混凝投药过程的建模与控制 - 发现报告

第三届挑战赛C3-城市供水处理混凝投药过程的建模与控制

2015-11-23 TIPDM 曾阿牛
报告封面

全国大学生数据挖掘竞赛 优秀作品 作品名称:城市供水处理混凝投药过程的建模与控制 荣获奖项:二等奖 作品单位:湖北工程学院 作品成员:贾园园万爽裴幸智 指导教师:张学新 基于BP神经网络的最佳投药量预测 摘要:混凝投药通过投加混凝剂除去原水中的杂质及其他有害物质,是城市供水过程中的重要环节之一,这一过程效果的好坏将直接影响后续处理工艺及出水水质的好坏。该过程具有影响因素多、大滞后性和非线性等特征,实际控制难度较大。本文基于广州南沙水厂提供的9397个投药控制数据,尝试构建一种基于BP神经网络混凝投药控制模型,来预测混凝剂的最佳投药量。 对于原数据集有缺失值情况,本文做基本预处理,用三次样条插值法对出水浊度进行插值估算,并剔除5外的极端异常值,按照出水浊度小于1.10NTU的标准,筛选出投药合格的6143个数据,以此作为样本数据。 针对第(1)问,本文运用平流沉淀理论,求得原水混凝沉淀到出水结束的滞后时间,约为80分钟,在实际范围70min--120min内。 针对第(2)问,本文以原水浊度、原水流速、原水PH值三个因素作为BP神经网络模型的输入神经元参数,对混凝剂投加量的训练样本和测试样本进行分析,得到预测的最佳投药量; 针对第(3)问,在第二问之上,增加出水浊度做为输入参数再次建立BP神经网络模型,并与第(2)问的模型进行比较。为了比较模型性能,我们又建立多元线性回归模型,找出四个变量与投药量的回归方程,通过在训练样本与测试样本上的预测效果,对BP神经网络模型和多元回归模型进行比较,分析绝对误差等指标,发现BP神经网络具有更强的非线性逼近能力,能够对投药量进行很好的仿真和预测效果。 针对第(4)问,本文查找文献[8],引入温度数据,验证文献[9]的理论模型,通过对数变换化为线性模型,并对模型的整体显著性和温度系数的显著性作检验,但是最后结果表明系数的显著性并不强,即温度对投药量的影响并不大,并从有关化学理论角度对此结果进行解释。 关键词:混凝投药;平流沉淀理论;BP神经网络;多元线性回归;最佳投药量 The optimal dosage prediction based onBP neural network Abstract:Coagulation Dosing remove impurities by adding coagulant and other harmfulsubstances in the raw water, is an important part of the city water supply process, this processis good or bad will directly affect the subsequent treatment process and water quality is goodor bad. This process has many factors, large hysteresis and non- linear characteristics, theactual control more difficult. 9397 Dosing Control Based on data provided by GuangzhouNansha water, try to build a BP neural network based on the optimal dose administeredCoagulation Dosage Control model to predict coagulant. For the original data set has missing values, this paper do basic pretreatment of waterturbidity estimate interpolating cubic spline interpolation, and excluding extreme outliers 5outside, according to the turbidity of less than 1.10NTU criteria selected Dosing qualified6143 data, as sample data. For the first (1) asked this paper, the theory of advection precipitation, coagulation andsedimentation to obtain raw water outlet end of the lag time of about 80 minutes, the actualscope of 70min - within 120min. For the first (2) Q, the paper raw water turbidity raw water flow rate, the raw water PHvalue of the three factors as the input neuron parameters BP neural network model, thetrainingand testing samples coagulant dosage was analyzed,Best predicted doseadministered; For the first (3) asked on the second question, increased water turbidity as inputparameters to establish BP neural network model again, and with paragraph (2) Q modelswere compared. To compare the performance of the model, we have set up multiple linearregression model to identify the four variables and dosage of the regression equation, bypredicting the effect on training samples and testing samples of BP neural network model andmultiple regression model comparison and analysis absolute error and other indicators, foundthat BP neural network has stronger nonlinear approximation ability to perform well on thedosage of the simulation and prediction. For the first (4) Q, the paper find [9], the introduction temperature data validation [10]A theoretical model by logarithmic transformation Huawei linear model, and the model of theoverall significance and temperature coefficient of significance for examination , but the finalresults show a significant coefficient is not strong, the effect of temperature on the dosage amount is not large, and from about the stoichiometric point of view to explain this result. Key words:Coagulation administration;Advection precipitation theory; BP neura lnetwork; Multiple linear regression; The optimum dosage 目录 1.挖掘目标...............................................................................................1 2.分析方法与过程....................................................................................1 2.2.1计算滞后时间………………………………………………………………………………32.2.2数据预处理…………………………………………………………………………………32.2.3筛选数据…………………………………………………………………………………..52.2.4构建BP神经网络模型……………………………………………………………………52.2.5构建多元线性回归模型…………………………………………………………………..92.2.6两种模型的对比分析……………………………………………………………………..122.2.7其他因素对最佳投药量的影响…………………………………………………………..12 4.参考文献.............................................................................................14 1.挖掘目标 针对现有水处理混凝投药控制方法中的不足,如烧杯实验耗时多;流动电流法精度低,适用范围狭窄;数学模型法不能适应控制情况而变化等问题。 本次建模的目标是利用广州南沙水厂投药控制系统实时采集的数据信息建立基于BP神经网络的混凝投药控制模型,此模型能够很好的对投药控制的各种不定因素进行非线性逼近,而且可以随着条件的需要变换修正各项参数,解决混凝投加与对应水絮凝沉淀后的浊度存在一段较长的时间差所造成的控制滞后问题,从而很好的预测出最佳混凝剂投药量,避免不必要的浪费,在保证水质的前提下节约水厂制水成本。 2.分析方法与过程 混凝投药过程包括以下几个步骤: 步骤一:结合已给样本数据集求出原水添加混凝剂反应到沉淀结束出水的滞后时间。步骤二:对数据进行预处理。步骤三:由出水是否合格结合滞后时间反推投药是否合格,筛选出所有投药合格的数据。步骤四:基于BP神经网络构建模型,对数据进行训练与预测。步骤五:构建多元线性回归模型确定表达式。步骤六:分析两种模型的仿真和预测效果并进行比较,给出最优模型。 ☆2.2具体步骤 ▪2.2.1计算滞后时间【问题(一)求解】 如图3投药控制流程图,由于混凝沉淀池是一个大容积对象,对于混凝剂投加与对应水絮凝沉淀后的浊度存在一段较长的时间差。滞后性是水处理过程中的一大难题,因此,求出有效地滞后时间显得尤为重要。 根据有关资料,了解到平流沉淀池的理论停留时间为[1]: 其中V表示沉淀池的有效容积,Q表示原水平均流量。 为此,我们调查了广州南沙水厂混合反应沉淀池的相关数据[2],其工艺采用竖流式折板絮凝池。整个絮凝池设计分为三段,每段絮凝池容积依次递增,絮凝区总反应时间为15.0min。平流沉淀池4座,每座分两格,单座尺寸为378.528.85.111530.08mmmm,计算得到水平流速为38651.707/m h,有效水深为4.0m,因此理论时间为: 综上,总滞后