行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

第三届挑战赛C3-城市供水处理混凝投药过程的建模与控制

2015-11-23 TIPDM 曾阿牛

挖掘目标

针对现有水处理混凝投药控制方法的不足，如烧杯实验耗时多、流动电流法精度低、数学模型法不能适应控制情况而变化等问题，本研究旨在利用广州南沙水厂投药控制系统实时采集的数据信息建立基于BP神经网络的混凝投药控制模型，以解决混凝投加与对应水絮凝沉淀后的浊度存在较长的时间差所造成的控制滞后问题，从而预测最佳混凝剂投药量，节约水厂制水成本。

分析方法与过程

总体流程

研究分为六个步骤：计算滞后时间、数据预处理、筛选数据、构建BP神经网络模型、构建多元线性回归模型、对比分析两种模型。

具体步骤

计算滞后时间：根据平流沉淀理论，求得原水混凝沉淀到出水结束的滞后时间约为80分钟。
数据预处理：对原始数据进行缺失值处理、离群值处理和极端值处理，提高数据质量。
筛选数据：按出水浊度小于1.10NTU的标准，筛选出投药合格的6143个数据作为样本数据。
构建BP神经网络模型：以原水浊度、原水流速、原水PH值三个因素作为输入，构建BP神经网络模型预测最佳投药量。模型的准确度分别为44.6%和51.0%。
构建多元线性回归模型：以原水PH、原水浊度、原水流量、出水浊度为自变量，构建多元线性回归模型，模型训练效果较好。
对比分析：对比BP神经网络模型和多元线性回归模型的性能，发现BP神经网络模型在仿真和预测效果上优于多元线性回归模型。

其他因素对最佳投药量的影响

引入温度数据，验证文献中的理论模型，但结果表明温度对投药量的影响并不大，从化学理论角度解释了这一结果。

结果分析

通过数据预处理、构建和对比两种模型，验证了BP神经网络模型在混凝投药量预测方面的有效性，并分析了温度对投药量的影响。

结论

基于BP神经网络的混凝投药系统预测模型具有较强的自学习性和自适应性，可在此基础上实现前馈神经网络预测控制以实现混凝的最佳投加，加速我国水厂自动化的进度。

全国大学生数据挖掘竞赛优秀作品作品名称：城市供水处理混凝投药过程的建模与控制荣获奖项：二等奖作品单位：湖北工程学院作品成员：贾园园万爽裴幸智指导教师：张学新基于BP神经网络的最佳投药量预测摘要：混凝投药通过投加混凝剂除去原水中的杂质及其他有害物质，是城市供水过程中的重要环节之一，这一过程效果的好坏将直接影响后续处理工艺及出水水质的好坏。该过程具有影响因素多、大滞后性和非线性等特征，实际控制难度较大。本文基于广州南沙水厂提供的9397个投药控制数据，尝试构建一种基于BP神经网络混凝投药控制模型，来预测混凝剂的最佳投药量。对于原数据集有缺失值情况，本文做基本预处理，用三次样条插值法对出水浊度进行插值估算，并剔除5外的极端异常值，按照出水浊度小于1.10NTU的标准，筛选出投药合格的6143个数据，以此作为样本数据。针对第（1）问，本文运用平流沉淀理论，求得原水混凝沉淀到出水结束的滞后时间，约为80分钟，在实际范围70min--120min内。针对第（2）问，本文以原水浊度、原水流速、原水PH值三个因素作为BP神经网络模型的输入神经元参数，对混凝剂投加量的训练样本和测试样本进行分析，得到预测的最佳投药量；针对第（3）问，在第二问之上，增加出水浊度做为输入参数再次建立BP神经网络模型，并与第（2）问的模型进行比较。为了比较模型性能，我们又建立多元线性回归模型，找出四个变量与投药量的回归方程，通过在训练样本与测试样本上的预测效果，对BP神经网络模型和多元回归模型进行比较，分析绝对误差等指标，发现BP神经网络具有更强的非线性逼近能力，能够对投药量进行很好的仿真和预测效果。针对第（4）问，本文查找文献[8]，引入温度数据，验证文献[9]的理论模型，通过对数变换化为线性模型，并对模型的整体显著性和温度系数的显著性作检验，但是最后结果表明系数的显著性并不强，即温度对投药量的影响并不大，并从有关化学理论角度对此结果进行解释。关键词：混凝投药；平流沉淀理论；BP神经网络；多元线性回归；最佳投药量 The optimal dosage prediction based onBP neural network Abstract:Coagulation Dosing remove impurities by adding coagulant and other harmfulsubstances in the raw water, is an important part of the city water supply process, this processis good or bad will directly affect the subsequent treatment process and water quality is goodor bad. This process has many factors, large hysteresis and non- linear characteristics, theactual control more difficult. 9397 Dosing Control Based on data provided by GuangzhouNansha water, try to build a BP neural network based on the optimal dose administeredCoagulation Dosage Control model to predict coagulant. For the original data set has missing values, this paper do basic pretreatment of waterturbidity estimate interpolating cubic spline interpolation, and excluding extreme outliers 5outside, according to the turbidity of less than 1.10NTU criteria selected Dosing qualified6143 data, as sample data. For the first (1) asked this paper, the theory of advection precipitation, coagulation andsedimentation to obtain raw water outlet end of the lag time of about 80 minutes, the actualscope of 70min - within 120min. For the first (2) Q, the paper raw water turbidity raw water flow rate, the raw water PHvalue of the three factors as the input neuron parameters BP neural network model, thetrainingand testing samples coagulant dosage was analyzed,Best predicted doseadministered; For the first (3) asked on the second question, increased water turbidity as inputparameters to establish BP neural network model again, and with paragraph (2) Q modelswere compared. To compare the performance of the model, we have set up multiple linearregression model to identify the four variables and dosage of the regression equation, bypredicting the effect on training samples and testing samples of BP neural network model andmultiple regression model comparison and analysis absolute error and other indicators, foundthat BP neural network has stronger nonlinear approximation ability to perform well on thedosage of the simulation and prediction. For the first (4) Q, the paper find [9], the introduction temperature data validation [10]A theoretical model by logarithmic transformation Huawei linear model, and the model of theoverall significance and temperature coefficient of significance for examination , but the finalresults show a significant coefficient is not strong, the effect of temperature on the dosage amount is not large, and from about the stoichiometric point of view to explain this result. Key words:Coagulation administration;Advection precipitation theory; BP neura lnetwork; Multiple linear regression; The optimum dosage 目录 1.挖掘目标...............................................................................................1 2.分析方法与过程....................................................................................1 2.2.1计算滞后时间………………………………………………………………………………32.2.2数据预处理…………………………………………………………………………………32.2.3筛选数据…………………………………………………………………………………..52.2.4构建BP神经网络模型……………………………………………………………………52.2.5构建多元线性回归模型…………………………………………………………………..92.2.6两种模型的对比分析……………………………………………………………………..122.2.7其他因素对最佳投药量的影响…………………………………………………………..12 4.参考文献.............................................................................................14 1.挖掘目标针对现有水处理混凝投药控制方法中的不足，如烧杯实验耗时多；流动电流法精度低，适用范围狭窄；数学模型法不能适应控制情况而变化等问题。本次建模的目标是利用广州南沙水厂投药控制系统实时采集的数据信息建立基于BP神经网络的混凝投药控制模型，此模型能够很好的对投药控制的各种不定因素进行非线性逼近，而且可以随着条件的需要变换修正各项参数，解决混凝投加与对应水絮凝沉淀后的浊度存在一段较长的时间差所造成的控制滞后问题，从而很好的预测出最佳混凝剂投药量，避免不必要的浪费，在保证水质的前提下节约水厂制水成本。 2.分析方法与过程混凝投药过程包括以下几个步骤：步骤一：结合已给样本数据集求出原水添加混凝剂反应到沉淀结束出水的滞后时间。步骤二：对数据进行预处理。步骤三：由出水是否合格结合滞后时间反推投药是否合格，筛选出所有投药合格的数据。步骤四：基于BP神经网络构建模型，对数据进行训练与预测。步骤五：构建多元线性回归模型确定表达式。步骤六：分析两种模型的仿真和预测效果并进行比较，给出最优模型。 ☆2.2具体步骤 ▪2.2.1计算滞后时间【问题（一）求解】如图3投药控制流程图，由于混凝沉淀池是一个大容积对象，对于混凝剂投加与对应水絮凝沉淀后的浊度存在一段较长的时间差。滞后性是水处理过程中的一大难题，因此，求出有效地滞后时间显得尤为重要。根据有关资料，了解到平流沉淀池的理论停留时间为[1]：其中V表示沉淀池的有效容积，Q表示原水平均流量。为此，我们调查了广州南沙水厂混合反应沉淀池的相关数据[2]，其工艺采用竖流式折板絮凝池。整个絮凝池设计分为三段，每段絮凝池容积依次递增，絮凝区总反应时间为15.0min。平流沉淀池4座，每座分两格，单座尺寸为378.528.85.111530.08mmmm,计算得到水平流速为38651.707/m h，有效水深为4.0m，因此理论时间为：综上，总滞后

点击免费查看完整报告