Штучний інтелект відкриває геноміку рослин: дослідження Університету Хайнань

Відредаговано: Vera Mo

Новаторське дослідження Університету Хайнань, опубліковане в Tropical Plants, демонструє інтеграцію штучного інтелекту (ШІ) в геноміку рослин. Дослідники використовують великі мовні моделі (ВММ) для декодування складної генетичної інформації. Цей підхід обіцяє прогрес у сільському господарстві, збереженні біорізноманіття та продовольчій безпеці.

Геноміка рослин довгий час стикалася з проблемою величезних і складних генетичних даних. Традиційні методи мають труднощі з великими наборами даних і геномними варіаціями. ВММ пропонують новий спосіб аналізу геномів рослин, використовуючи паралелі між генетичними послідовностями та людською мовою.

Дослідження зосереджується на адаптації ВММ для розуміння унікальних характеристик геномів рослин. На відміну від людських мов із граматичними правилами, геноми рослин працюють за біологічними правилами, що регулюють експресію генів. Дослідники навчають ВММ на великих наборах геномних даних рослин, щоб розпізнавати закономірності та прогнозувати функції генів.

Процес навчання включає попереднє навчання та точне налаштування. Попереднє навчання передбачає обробку ВММ неанотованих геномних даних рослин для виявлення подібностей. Точне налаштування використовує анотовані набори даних для вдосконалення прогностичних можливостей моделі для біологічних функцій.

У дослідженні успішно застосовано різні архітектури ВММ, адаптовані для геноміки рослин. До них належать моделі лише з кодувальником, такі як DNABERT, моделі лише з декодувальником, такі як DNAGPT, і моделі кодувальник-декодувальник, такі як ENBED. Кожна модель чудово справляється з геномними даними, від ідентифікації енхансерів і промоторів до прогнозування моделей експресії генів.

Рослинні моделі, такі як AgroNT і FloraBERT, продемонстрували покращену продуктивність в анотуванні геномів рослин. Зосереджуючись на лінгвістичних характеристиках послідовностей ДНК, ці моделі розкривають складнощі регуляції генів. Це дає змогу застосовувати геномну інформацію в практичних сільськогосподарських контекстах.

У дослідженні визнаються прогалини в існуючих архітектурах ВММ. Поточні моделі переважно навчаються на наборах даних тварин або мікробів, яким бракує комплексних геномних анотацій для видів рослин. Автори виступають за ВММ, орієнтовані на рослини, які включають різноманітні геномні набори даних, особливо від менш вивчених видів, таких як тропічні рослини.

ШІ та ВММ у геноміці рослин можуть прискорити стратегії покращення врожаю. Це може призвести до кращої адаптації видів рослин до мінливих умов навколишнього середовища. Зрештою, це посилює зусилля зі збереження біорізноманіття, що має вирішальне значення для глобальної продовольчої безпеки.

Це дослідження підкреслює трансформаційний потенціал ШІ в геноміці рослин. Поєднуючи обчислювальну лінгвістику та генетичний аналіз, дослідники можуть революціонізувати наше розуміння біології рослин. Це обіцяє підвищити продуктивність сільського господарства та сприяти стійким практикам.

Майбутні зусилля вдосконалять архітектури ВММ і розширять набори даних для навчання. Це включає ширший спектр видів рослин і дослідження реальних сільськогосподарських застосувань. Це ключове дослідження закладає основу для нової ери в дослідженнях геноміки рослин, де ШІ відіграє центральну роль.

Джерела

  • Scienmag: Latest Science and Health News

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.