Speaker
Description
Термостабильные ДНК-полимеразы, такие как широко используемая в полимеразной цепной реакции (ПЦР) Taq-полимераза, играют незаменимую роль в биотехнологиях, требующих температурных циклов, поскольку способны сохранять активность при высоких температурах. Для повышения эффективности и точности ПЦР, а также других технологий на основе полимераз, важно развивать новые варианты этих ферментов. Учитывая большое количество еще не исследованных видов микроорганизмов, разработка методов быстрого отбора потенциальных кандидатов становится особенно актуальной, чтобы сократить объем необходимых исследований.
Предложенный в работе [1] метод главных компонент для последовательностей любого типа, в том числе, символьных, позволяет представить любой набор последовательностей в виде точек евклидова пространства, так же, как и в традиционном анализе PCA, последовательности с похожими свойствами оказываются расположенными близко друг к другу.
Цель данного исследования заключается в использовании метода главных компонент (PCA) для оценки взаимосвязи между сходством и различиями в аминокислотных последовательностях различных типов ДНК-полимераз и их термостабильностью. В эксперименте использованы данные о 14,632 перспективных аминокислотных последовательностях ДНК-полимераз, предоставленные лабораторией генетических технологий Института химической биологии и фундаментальной медицины СО РАН. Данные о оптимальной температуре для 456 ДНК-полимераз (40-83℃) собраны с помощью базы данных ThermoBase, а данные для 7,369 ДНК-полимераз (3-103℃) — с помощью базы данных DeepTP, что обеспечило поддержку анализа и выводов данного исследования.
Список литературы
[1] Efimov V.M., Efimov K.V., Kovaleva V.Y. Principal component analysis and its generalizations for any type of se- quence (PCA-Seq). Vavilovskii Zhurnal Genetiki i Selektsii = Vavilov Journal of Genetics and Breeding. 2019;23(8):1032-1036. DOI 10.18699/VJ19.584
Секция конференции | Биоинформатика и системная компьютерная биология |
---|