Исследователи Стэнфорда представили Evo: ИИ для генерации синтетических геномов

Отредактировано: Надежда Садикова

Исследователи из Стэнфордского университета и Института Arc разработали Evo, искусственный интеллект, способный генерировать синтетические геномные последовательности с нуля. Этот инструмент, обученный на микробных геномных данных, может быть применен в биотехнологии и синтетической биологии.

Модели искусственного интеллекта изменили методы работы в различных дисциплинах, особенно в биомедицине и молекулярной биологии. В последние годы появились инновационные инструменты ИИ с широкими приложениями, включая идентификацию терапевтических мишеней и предсказание структур белков.

Недавнее исследование, опубликованное в журнале Science, представило Evo, новый инструмент на основе искусственного интеллекта, способный генерировать полные геномы с нуля. В отличие от других ИИ, Evo использует большие языковые модели, что позволяет ему генерировать целые бактериальные геномные последовательности. Его разработка открывает новые возможности для проектирования белков и синтетических геномов с использованием искусственного интеллекта.

Evo — это генеративный ИИ, основанный на больших языковых моделях, способный выявлять шаблоны в ДНК и генерировать новые последовательности. Под руководством доктора Брайана Хи команда обучила Evo на данных более 27 миллионов прокариотических геномов, бактериофагов и плазмид, что позволило ему выявлять эволюционные шаблоны в ДНК.

Одним из значительных достижений Evo по сравнению с предыдущими моделями ИИ является его большая длина контекста, что позволяет ему обрабатывать длинные последовательности ДНК. В то время как другие ИИ анализируют короткие фрагменты ДНК, Evo способен анализировать длинные последовательности, что улучшает его способность выявлять связи между генами и геномными последовательностями.

После разработки Evo исследовательская команда оценила его эффективность в предсказании влияния мутаций на функциональность белков. Для этого авторы ввели определенные мутации в геном прокариотических клеток и сравнили предсказания Evo с результатами других работ, в которых были сгенерированы те же мутации. Результаты показали, что Evo более эффективен в предсказании эффектов мутаций, чем другие модели ИИ.

На втором этапе исследования команда доктора Хи оценила потенциал Evo для проектирования оптимизированных версий белка Cas9, важного инструмента для генетического редактирования с помощью CRISPR. Для этого авторы обучили модель на более чем 70 000 бактериальных последовательностях, кодирующих белки Cas и их связанные РНК.

После обучения Evo смог сгенерировать миллионы синтетических последовательностей, кодирующих ферменты Cas9. Доктор Хи и его команда проанализировали эти последовательности и выбрали 11 самых перспективных версий для синтеза в лаборатории и оценки. Результаты показали, что некоторые белки Cas9, синтезированные Evo, были столь же эффективны, как и коммерческая версия.

До сих пор получение более эффективных версий Cas9 представляло собой значительную проблему для исследователей. Для этого необходимо было находить бактерии, которые эволюционировали, чтобы иметь более мощные версии этого фермента. "Нам не нужно ждать эволюции, чтобы создать новую Cas9", объясняет доктор Хи.

Генерация синтетических геномов остается одной из основных задач в синтетической биологии. Доктор Хи и его команда задавались вопросом, сможет ли Evo генерировать полные синтетические геномные последовательности. ИИ успешно сгенерировал большую часть геномных последовательностей, включая важные гены для клеточной функции, но пропустил критически важные геномные области, необходимые для выживания.

Еще одно ограничение Evo было описано при генерации синтетических последовательностей белка Cas9, когда ИИ предложил некоторые нефункциональные последовательности. Такие ошибки наблюдаются и в других генеративных ИИ-моделях, основанных на больших языковых моделях, таких как ChatGPT.

Несмотря на свои ограничения, Evo представляет собой значительный шаг вперед в использовании генеративных инструментов ИИ. Будущие исследования будут направлены на улучшение этого инструмента для проектирования белков и синтетических геномов.

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.