Введение
Введение. Существует несколько исследовательских работ, посвященных разработке эффективной модели на основе машинного обучения для прогнозирования и анализа качества проб воды. В работе [1] исследователи предложили применить Метод опорных векторов (SVM) вместе с методом оптимизации роя частиц (PSO) для прогнозирования качества воды в реке Люси. Модель показала высокую точность при оценке качества воды путем имитационного моделирования. В работе [2] было проведено исследование двух озер - Чини и Бера. Набор данных состоял из одиннадцати признаков, которые использовались для прогнозирования концентрации растворенного кислорода в воде. Концентрация растворенного кислорода была разделена на три уровня: низкий, средний, высокий. К данным была применена модель машины опорных векторов с использованием вычислительного ядра ANOVA, и точность составила 74 %. В работе [3] предложена древовидная модель принятия решений, которая применяется для определения уровня содержания хлорофилла в обычных образцах воды. Эта преобладающая информация о хлорофилле помогает предопределить качество воды в будущем, она использует принцип трансформации водорослей. Точность оценки качества воды составила 80 %. В [4] разработана модель прогнозирования индекса качества воды с использованием многослойного персептрона MLP на реке Кинта в регионе Перак в Малайзии. Они используют трехслойную модель, включающую один входной слой, затем один скрытый слой и один слой выходных нейронных узлов. Эта модель превосходит другие модели и показывает, что подход MLP в этой области является очень надежным методом. Модель MLP достигла наивысшей точности при прогнозировании индекса качества воды (WQI).
Методология
Цель работы: разработать систему прогнозирования качества воды водного объекта с применением машинного обучения. Материалы и методы. Объект исследования: река Ока. Река Ока берет свое начало на Среднерусской возвышенности, а устье реки — расположено в Нижнем Новгороде. Длина Оки составляет около 1500 км, а площадь бассейна составляет 245 000 км². Ока имеет порядка 120 больших и малых притоков, самым крупным из них является Москва река, которая играет ключевую роль в экологическом состоянии водного объекта. Для машинного обучения прогноза химического и микробиологического анализа воды был выбран участок у города Рязань. Проведена сравнительная оценка качества воды р. Оки как поверхностного источника водоснабжения по средним многолетним значениям 52 контрольных показателей (органолептических, микробиологических, химических) и проценту проб, не соответствующих гигиеническим нормативам, в створах трех водозаборов г. Рязани за период 2012–2019 гг. Средняя многолетняя концентрация аммиака в воде Соколовского водозабора составила 0,48 мг/л и была существенно ниже, чем в контрольных точках Окского и Борковского водозаборов, соответственно в 1,6 и 2,1 раза (р <0,05). При этом почти в каждой пятой пробе, отобранной в створе Борковского водозабора, регистрировались концентрации аммиака, превышающие ПДК, тогда как аналогичный показатель для Окского водозабора был в 2,8 раза меньше и составил 7,5%. Ни в одной разовой пробе воды в контрольной точке Соколовского водозабора превышений ПДК ионов аммония не регистрировалось. Статистически значимых различий в средних многолетних значениях ХПК и БПК5 в водах рассматриваемых водозаборов выявлено не было, а процент разовых проб, в которых указанные показатели не соответствовали гигиеническим требованиям, находился в пределах 22,7–32,5% и 61,8–75,0%. Исследование показало, что среднее содержание ОКБ в водах Окского и Борковского водозаборов составило соответственно 813,3 КОЕ/100 мл и 818,9 КОЕ/100 мл и было в 1,5 раза выше аналогичного показателя в контрольном створе Соколовского водозабора (р <0,05) (рис.1).
Результаты
Рисунок 1 – Доля проб, не соответствующих гигиеническим нормативам, % Для машинного обучения необходимо: − Данные – результаты испытаний по метеорологическим, химическим и микробиологическим показателям (в качестве примера взяты показатели БПК5, ХПК, аммиак, КОЕ; − Признаки – результаты прошлых исследований; − Алгоритм – подбор и применение методов машинного обучения, от которого зависит точность и скорость работы. − Разработанная модель будет помогать в первую очередь прогнозировать состояние поверхностных вод как поверхностного источника водоснабжения по гигиеническим и экологическим показателям, а также рекомендовать предприятиям и иным источникам загрязнения меры по снижению попадания веществ в водный объект [5,6]. Результаты исследования. Полученная нейросеть обучена для прогноза движения, тепломассопередачи и распространения поллютантов текучей среды с целю моделирования с помощью уравнений Навье-Стокса, которые заложены в коде Python [7]. При помощи библиотек Pandas, Matplotlib и Seaborn был подготовлен оптимальный dataset для обучения машины. Программой были построены диаграммы рассеяния для скорости потока, коэффициента продольной дисперсии, максимальной концентрации, времени пика, начала и окончания загрязнения (рис.2).
Результаты
Рисунок 2 – Диаграммы рассеяния для (а): скорость потока; (b): коэффициент продольной дисперсии
Обсуждение
Согласно рисунку, диаграмма рассеяния показывает, что все экспериментальные значения завышены со средней процентной ошибкой, равной 8%. Первый эксперимент показал, что модель правильно выводит наблюдаемые значения, но значительно завышает прогноз (рис.2a).
Обсуждение
На рисунке 2b прогнозируемые коэффициенты продольной дисперсии нанесены на график в сравнении с наблюдаемыми. Модель дает хорошую оценку коэффициента продольной дисперсии. Коэффициент продольной дисперсии зависит от ширины и глубины реки;
Выводы
Следовательно, разница между прогнозируемыми и наблюдаемыми коэффициентами продольной дисперсии связана с тем, что наша модель не учитывает геометрию реки.