Введение
Селекция — искусство, наука и технология создания новых сортов и гибридов, усовершенствования сельскохозяйственных растений. Целью селекции растений в 21 веке является удовлетворение потребностей человечества селекционными достижениями в кратчайшие сроки.
Материалы и методы
Перед селекционерами стоит ряд вызовов, которые неосуществимы с применением только классических методов: • Ежегодный прирост населения составляет 1,5% в год, тогда как рост производства, например зерна составляет 0,5 % в год; • Проблемы с окружающей средой вследствие сверхэксплуатации; • Конкуренция между крупнейшими семенными транснациональными компаниями и национальными компаниями отражается на сортименте и стоимости семян; • Изменение климата влечет изменение в количестве и качестве биотических и абиотических факторов. Многие методы уже позволили ускорить создание новых гибридов и сортов, благодаря внедрению их в селекционные программы, например, молекулярной селекции, геномного редактирования, in vitro-методы. Но с ростом населения растут и потребности человечества, запрос общества состоит не только в увеличении продуктивности культур, но и качества, и стабильности производства продуктов питания, его доступности, словом - условий продовольственной безопасности [6]. Решением такого запроса является развитие и использование современных цифровых и автоматизированных методов селекции [3]. Одним из направлений ускорения селекции является предсказательная селекция, целью которой является выработка новых технологических решений для ускоренной, высокоэффективной селекции растений. Технологии «предсказательной селекции» интегрируют большие данные гено-, фенотипирования, условий среды и агротехнологии с целью расширения возможностей создания новых сортов и гибридов. Анализ таких данных «фенотип-генотип» возлагают на машинное обучение, что требует больших вычислительных мощностей [4]. В настоящее время специалисты в области селекции все больше прибегают к использованию возможностей предсказательной селекции. Создание и отбор селекционного материала возможно проводить более эффективно с использованием методов машинного обучения, а не только полагаясь на оценку фенотипа потомств [2].
Результаты
Основной сложностью в селекции растений является изучение и объяснение с точки зрения генетики количественных признаков, которые очень сложны и контролируются несколькими генами, зависящими от условий окружающей среды (урожайность, продуктивность, качество товарной продукции, устойчивость к абиотическим факторам и т.д.). Селекционные схемы скрещивания и использование статистических методов позволяют выявить характер взаимодействия важных компонентов количественных признаков для получения наилучших F1 гибридов. Осложняется такая работа большим количеством родительских инбредных линий, с которыми проводят диаллельные скрещивания. Использование машинного обучения позволит прогнозировать результаты скрещиваний и точно проводить расчет ОКС и СКС, что сократит временные и денежные затраты на создание F1 гибридов (рис. 1) [1]. В сфере селекции растений используются различные инструменты машинного обучения, которые охватывают следующие направления: • Поиск и использование QTL (локусов количественных признаков), которые связаны с определенными хозяйственно ценными признаками • Оценку экспрессии отдельных локусов и изменчивость признака, контролируемого данным локусом • Предсказание экспрессии и проявления найденных локусов в новых генотипах
Результаты
Для селекционеров получение большого объема разнородных данных будет способствовать более эффективной классификации фенотипов и генотипов потомства, а методы машинного обучения позволят оптимизировать расход ресурсов и времени на анализ. Некоторые методы, основанные на использовании машинного обучения уже успешно внедрены и используются в селекции растений: • Реконструкция генетических сетей • Интеграция мультиомиксных данных • Анализ данных фенотипирования • Геномное предсказание фенотипа • Открытие генов • Картирование cis-регуляторных элементов • Филогенетический анализ • Геномное предсказание фенотипа Большинство подходов на основе машинного обучения являются высокопроизводительными и дают возможность повторного использования в различных селекционных программах. Однако, существуют ряд проблем, основная из которых – разнообразие получаемых данных различными исследователями. Зачастую эти данные фрагментарны и необходимо комплексное составление стандартизированных баз данных. Большинство подходов на основе машинного обучения надежны, также они обладают высокой производительностью и могут быть повторно использованы в различных селекционных программах. Однако, существует ряд проблем, с которыми исследователи могут столкнуться, основная из которых заключается в неоднородности данных, получаемых разными исследователями. Часто эти данные фрагментарны, и для их полноценного использования необходимо проводить нормализацию и составлять стандартизированные базы данных.
Обсуждение
Другой проблемой является отсутствие доверия у большинства селекционеров к новым цифровым методам, так как классические методы селекции, основанные на статистике, использовались уже столетия и зарекомендовали себя как проверенные и эффективные. К тому же часто данные, полученные с использованием машинного обучения, не дают однозначной оценки значимости, а лишь ее диапазон. Еще одной проблемой является недостаточное количество подходов для анализа больших массивов получаемых данных, так как они объемны, разнородны и изменчивы, но с учетом развития информационных технологий и быстрому внедрению их в селекционный процесс эта проблема будет в кротчайшие сроки решена [5].
Обсуждение
Стоит отметить, что вопросы цифровой селекции нашли свое отражение в Федеральной научно-техническо программой развития сельского хозяйства до 2030 года в форме участия бизнеса и научно-исследовательских организаций в реализации комплексных научно-технических проектов, создания цифровых лабораторий в сфере селекции и генетики [7]. Более того, некоторыми авторами вопрос цифровизации сельского хозяйства прямо увязывается с научно-техническим развитием сельского хозяйства [9], когда вопросы создания средств производства, в том числе семян новых гибридов и сортом, представляются наиболее предпочтительными направлениями цифровой трансформации АПК.
Выводы
Таким образом, в настоящее время селекция растений переживает важнейший этап зарождения и становления высоких технологий предсказательного характера на основе цифровых решений, селекционеры получают доступ к новому инструментарию на основе искусственного интеллекта и больших данных, увеличивающих его возможности создания новых «шедевристых» селекционных достижений.