Speaker
Description
Аннотация бактериальных геномов и их конкретных регуляторных геномных последовательностей сайтами связывания транскрипционных факторов (ССТФ), регулирующих экспрессию генов, является актуальной биологической задачей, поскольку работа клетки в целом, и, соответственно, наработка ценных продуктов микробиологического синтеза критическим образом зависит от существующих регуляторных геномных связей микроорганизма-биопродуцента. В данной работе реализован вычислительный конвейер, состоящий из следующих необходимых этапов для полноценной аннотации бактериальных геномов с помощью известных подходов de novo поиска ССТФ: аннотирование генома оперонной структурой, необходимое для дальнейшего точного определения регуляторных/промоторных областей, поиск de novo мотивов в промоторах целевого генома, функциональной аннотации вновь выявленных ССТФ, поиск ортологичных генов заданного таксономического уровня и базы данных с последовательностями и аннотациями известных бактериальных геномов. Такой комплексный подход позволяет критически сократить затраты ресурсов персонала, при этом позволяя оптимизировать входные данные больших объемов и быстро осуществлять дополнительную настройку шагов вычислений для получения более достоверных результатов, контролируя поток данных.
Реализованный конвейер состоит из набора скриптов на языках программирования Python, bash и с использованием системы Conda для изоляции зависимостей. Реализованный конвейер использует также СУБД SQLite, программы GOST для определения ортологических отношений между генами разных организмов, MP3 для выполнения поиска мотивов методом филогенетического футпритинга, TomTom для аннотации полученных de novo мотивов с базами известных и экспериментально подтвержденных мотивов.
Работа была поддержана в рамках Программы Курчатовского геномного центра ИЦиГ СО РАН (№ 075-15-2019-1662).
Секция конференции | Биоинформатика и системная компьютерная биология |
---|