Платформа «Агрориск»Управление рисками в АПК

Статья журнала

МАШИННОЕ ОБУЧЕНИЕ КАК ИНСТРУМЕНТ ДЛЯ ПРОГНОЗИРОВАНИЯ КАЧЕСТВА ВОДЫ ВОДНОГО ОБЪЕКТА

Цитирование

ТУРБИНСКИЙ , В.В. МАШИННОЕ ОБУЧЕНИЕ КАК ИНСТРУМЕНТ ДЛЯ ПРОГНОЗИРОВАНИЯ КАЧЕСТВА ВОДЫ ВОДНОГО ОБЪЕКТА / В.В. ТУРБИНСКИЙ // Управление рисками в АПК. – 2024. – № S3 (53). – C. -. – .

Аннотация

В статье рассмотрены возможности применения методов машинного обучения для решения различных задач в области гидрологии, гигиены воды и экологии. Проведен литературный обзор опыта использования машинного обучения в данных сферах. В статье приведен разработанный метод построения модели машинного обучения для анализа качества воды в российских реках на примере реки Оки в Рязанской области. Для проведения анализа и поиска метода машинного обучения был использован язык Python и следующие библиотеки: Pandas, Scikit-learn, Matplotlib и Seaborn. На основе прогностических расчётов по гидродинамическим законам, законам Навье-Стокса и Фика машина обучена графически представлять уровни загрязнения воды различными элементами и составлять прогнозный сценарий изменения концентрации загрязняющих веществ на заданный промежуток времени.

Ключевые слова

машинное обучение, моделирование, python, прогнозирование, качество воды, гигиенические нормативы, диаграммы рассеяния.

Введение

Введение. Существует несколько исследовательских работ, посвященных разработке эффективной модели на основе машинного обучения для прогнозирования и анализа качества проб воды. В работе [1] исследователи предложили применить Метод опорных векторов (SVM) вместе с методом оптимизации роя частиц (PSO) для прогнозирования качества воды в реке Люси. Модель показала высокую точность при оценке качества воды путем имитационного моделирования. В работе [2] было проведено исследование двух озер - Чини и Бера. Набор данных состоял из одиннадцати признаков, которые использовались для прогнозирования концентрации растворенного кислорода в воде. Концентрация растворенного кислорода была разделена на три уровня: низкий, средний, высокий. К данным была применена модель машины опорных векторов с использованием вычислительного ядра ANOVA, и точность составила 74 %. В работе [3] предложена древовидная модель принятия решений, которая применяется для определения уровня содержания хлорофилла в обычных образцах воды. Эта преобладающая информация о хлорофилле помогает предопределить качество воды в будущем, она использует принцип трансформации водорослей. Точность оценки качества воды составила 80 %. В [4] разработана модель прогнозирования индекса качества воды с использованием многослойного персептрона MLP на реке Кинта в регионе Перак в Малайзии. Они используют трехслойную модель, включающую один входной слой, затем один скрытый слой и один слой выходных нейронных узлов. Эта модель превосходит другие модели и показывает, что подход MLP в этой области является очень надежным методом. Модель MLP достигла наивысшей точности при прогнозировании индекса качества воды (WQI).

Методология

Цель работы: разработать систему прогнозирования качества воды водного объекта с применением машинного обучения. Материалы и методы. Объект исследования: река Ока. Река Ока берет свое начало на Среднерусской возвышенности, а устье реки — расположено в Нижнем Новгороде. Длина Оки составляет около 1500 км, а площадь бассейна составляет 245 000 км². Ока имеет порядка 120 больших и малых притоков, самым крупным из них является Москва река, которая играет ключевую роль в экологическом состоянии водного объекта. Для машинного обучения прогноза химического и микробиологического анализа воды был выбран участок у города Рязань. Проведена сравнительная оценка качества воды р. Оки как поверхностного источника водоснабжения по средним многолетним значениям 52 контрольных показателей (органолептических, микробиологических, химических) и проценту проб, не соответствующих гигиеническим нормативам, в створах трех водозаборов г. Рязани за период 2012–2019 гг. Средняя многолетняя концентрация аммиака в воде Соколовского водозабора составила 0,48 мг/л и была существенно ниже, чем в контрольных точках Окского и Борковского водозаборов, соответственно в 1,6 и 2,1 раза (р <0,05). При этом почти в каждой пятой пробе, отобранной в створе Борковского водозабора, регистрировались концентрации аммиака, превышающие ПДК, тогда как аналогичный показатель для Окского водозабора был в 2,8 раза меньше и составил 7,5%. Ни в одной разовой пробе воды в контрольной точке Соколовского водозабора превышений ПДК ионов аммония не регистрировалось. Статистически значимых различий в средних многолетних значениях ХПК и БПК5 в водах рассматриваемых водозаборов выявлено не было, а процент разовых проб, в которых указанные показатели не соответствовали гигиеническим требованиям, находился в пределах 22,7–32,5% и 61,8–75,0%. Исследование показало, что среднее содержание ОКБ в водах Окского и Борковского водозаборов составило соответственно 813,3 КОЕ/100 мл и 818,9 КОЕ/100 мл и было в 1,5 раза выше аналогичного показателя в контрольном створе Соколовского водозабора (р <0,05) (рис.1).

Результаты

Рисунок 1 – Доля проб, не соответствующих гигиеническим нормативам, % Для машинного обучения необходимо: − Данные – результаты испытаний по метеорологическим, химическим и микробиологическим показателям (в качестве примера взяты показатели БПК5, ХПК, аммиак, КОЕ; − Признаки – результаты прошлых исследований; − Алгоритм – подбор и применение методов машинного обучения, от которого зависит точность и скорость работы. − Разработанная модель будет помогать в первую очередь прогнозировать состояние поверхностных вод как поверхностного источника водоснабжения по гигиеническим и экологическим показателям, а также рекомендовать предприятиям и иным источникам загрязнения меры по снижению попадания веществ в водный объект [5,6]. Результаты исследования. Полученная нейросеть обучена для прогноза движения, тепломассопередачи и распространения поллютантов текучей среды с целю моделирования с помощью уравнений Навье-Стокса, которые заложены в коде Python [7]. При помощи библиотек Pandas, Matplotlib и Seaborn был подготовлен оптимальный dataset для обучения машины. Программой были построены диаграммы рассеяния для скорости потока, коэффициента продольной дисперсии, максимальной концентрации, времени пика, начала и окончания загрязнения (рис.2).

Результаты

Рисунок 2 – Диаграммы рассеяния для (а): скорость потока; (b): коэффициент продольной дисперсии

Обсуждение

Согласно рисунку, диаграмма рассеяния показывает, что все экспериментальные значения завышены со средней процентной ошибкой, равной 8%. Первый эксперимент показал, что модель правильно выводит наблюдаемые значения, но значительно завышает прогноз (рис.2a).

Обсуждение

На рисунке 2b прогнозируемые коэффициенты продольной дисперсии нанесены на график в сравнении с наблюдаемыми. Модель дает хорошую оценку коэффициента продольной дисперсии. Коэффициент продольной дисперсии зависит от ширины и глубины реки;

Выводы

Следовательно, разница между прогнозируемыми и наблюдаемыми коэффициентами продольной дисперсии связана с тем, что наша модель не учитывает геометрию реки.

Источники

  1. Библиографический список:
  2. 1. Xiang Y., Jiang L. Water quality prediction using LS-SVM and particle swarm optimization //2009 second international workshop on knowledge discovery and data mining. – IEEE, 2009. – С. 900-904.
  3. 2. Solanki A., Agrawal H., Khare K. Predictive analysis of water quality parameters using deep learning //International Journal of Computer Applications. – 2015. – Т. 125. – №. 9. – С. 0975-8887.
  4. 3. Lu J., Huang T. Data mining on forecast raw water quality from online monitoring station based on decision-making tree //2009 Fifth International Joint Conference on INC, IMS and IDC. – IEEE, 2009. – С. 706-709.
  5. 4. Gazzaz N. M. et al. Artificial neural network modeling of the water quality index for Kinta River (Malaysia) using water quality variables as predictors //Marine pollution bulletin. – 2012. – Т. 64. – №. 11. – С. 2409-2420.
  6. 5. Литвинова, А. А., Дементьев, А. А., Ляпкало, А. А., Коршунова, Е. П. Сравнительная характеристика показателей качества воды реки Оки в местах водозаборов хозяйственно-питьевой системы водоснабжения города Рязани //Российский медико-биологический вестник имени академика ИП Павлова. – 2022. – Т. 30. – №. 4. – С. 481-488.
  7. 6. Жолдакова З. И., Синицына О. О., Турбинский В. В. О корректировке требований к зонам санитарной охраны источников централизованного хозяйственно-питьевого водоснабжения населения //Гигиена и санитария. – 2021. – Т. 100. – №. 11. – С. 1192-1197.
  8. 7. Карпенко Н. П., Ширяева М. А. Трёхмерное моделирование как система отображения суммарного химического загрязнения почв //Природообустройство. – 2021. – №. 1. – С. 6-14.
  9. 8. Наумова А. А. Уточнение параметров экстремальных летних осадков для проектирования и эксплуатации ГТС на малых водосборах Центрально-Черноземного района России //Природообустройство. – 2023. – №. 4. – С. 98-102.