Сад расходящихся белков

20-х годах ХХ века Эдвин Хаббл открыл зависимость относительной скорости движения галактик от расстояния между ними. Более далекие галактики разбегаются быстрее. Эти наблюдения позволили нам лучше понять возникновение и эволюцию Вселенной.

Оказывается, определенную аналогию этого явления можно обнаружить и в эволюции биологической вселенной. Белки движутся друг относительно друга в пространстве аминокислотных последовательностей. Как это происходит, описывается в работе Инны Поволоцкой и Фёдора Кондрашова из испанского Центра геномной регуляции в Барселоне [1].

Сад расходящихся белков
Рис. 1. Зависимость отношения числа сближающих (Nt) и разводящих (Na) замен от расстояния между белковыми последовательностями (оранжевый – синонимичные замены в нуклеотидной последовательности, синий – строгие замены в последовательности, зеленый – уточнение с использованием данных о функциональной схожести аминокислот).

Причиной движения галактик является Большой взрыв, а белки движутся благодаря мутациям. Каждая мутация может привести к изменению одной аминокислоты из сотен, составляющих белок, в результате белковая последовательность «перепрыгнет» в соседнюю точку пространства. Два десятка различных аминокислот, используемых для построения белков большинством известных организмов, дают размер пространства ~20500 для последовательности из 500 элементов. Расстояние между белками в этом пространстве можно определить как число позиций последовательности, в которых аминокислоты не совпадают. Направление движения между двумя белками, имеющими общего предка, определяется путем подсчета (по отдельности) количеств аминокислотных замен, сближающих (Nt) и разводящих (Na) выбранные последовательности. Отношение сближающих и разводящих замен показывает направление и скорость движения последовательностей друг относительно друга. Если Nt/ Na > 1, то белки сближаются, если < 1 — расходятся. В работе были проанализированы данные о последовательностях 572 групп белков, берущих свое начало в общем предке всех организмов, жившем более 3,5 млрд лет назад. Оказалось, что биологический закон разбегания белков противоположен космологическому закону разбегания галактик — чем дальше белки находятся друг от друга, тем медленнее они расходятся (рис. 1, синие и зеленые точки). Какое явление отражает эта зависимость? Если бы на движение белков не влиял отбор, то количество сближающих и разводящих замен было бы примерно равно практически во всем диапазоне расстояний. Это можно проверить, померяв движение белков только по синонимичным заменам нуклеотидов, то есть по заменам в последовательности ДНК, не приводящим к изменению кодируемых ими аминокислот, а значит и функции белка. И, действительно, по синонимичным заменам N/Na и 1 (рис. 1, оранжевые точки). Поэтому логично предположить, что на закон разбегания последовательностей влияет отбор, который может действовать на аминокислоты независимо в отдельных позициях или сразу на их комбинации. Последний случай в эволюционной биологии называется эпистаз.

Сад расходящихся белков
Рис. 2. При независимой эволюции каждой из позиций аминокислотной последовательности белок может двигаться по кратчайшему пути (а). Анализ последовательностей древних белков показывает, что они движутся по сложным ломаным траекториям, образующим разряженную сетку в пространстве возможных последовательностей (b).

Чтобы детальнее проверить гипотезу эпистатического отбора, были рассмотрены две группы позиций сравниваемых последовательностей — «дивергентные» и «конвергентные». Дивергентные позиции — это позиции в последовательности, любая мутация в которых приведет к расхождению белков. Конвергентные — позиции, которые могут сблизить белки, если в них произойдет мутация. Для обеих групп была посчитана доля накопленных замен по отношении к синонимичным заменам, что дает значение скорости накопления эволюционных изменений. Результаты анализа показали, что замены в дивергентных позициях составляют ~2% от нейтральных. Следовательно, эти аминокислоты с большой вероятностью критичны для нормального функционирования белка. Таким образом, отбор «тормозит» движение белков по дивергентным позициям. С другой стороны, конвергентные позиции являются направлениями для потенциального сближения последовательностей. В таких позициях аминокислоты в разных последовательностях разные, и с адаптивностью белка они могут быть совсем не связаны, так как если аминокислота присутствует в белке у одного вида, то она может присутствовать без отрицательных влияний и у другого вида. В этом случае скорость их эволюции не будет зависеть от расстояния между белками. Тем не менее, расчет скорости эволюции конвергентных позиций показал, что она быстро уменьшается с увеличением расстояния между сравниваемыми белками. Такая зависимость должна наблюдаться, если функция белка зависит не только от консервативных позиций, но и от комбинаций аминокислот в части остальных позиций последовательности. Подобных «теневых» комбинаций, опосредованно влияющих на адаптивность, может быть несколько. Тогда, если одна замена, ведущая к альтернативной комбинации, все же произошла, за ней должны быстро последовать другие, чтобы белок приобрел новую устойчивую структуру, после чего его эволюция опять замедляется. В этом случае при дивергенции альтернативных вариантов белка в процессе эволюции в них «попадают» разные комбинации, что и приводит к снижению скорости изменений в конвергентных позициях. Поэтому белки на большом расстоянии будут разбегаться медленнее.

Галактики разлетаются от точки возникновения физической Вселенной, а в белковой вселенной всё гораздо запутаннее. Белки не бегут по кратчайшей траектории от точки к точке пространства аминокислотных последовательностей (рис. 2а). За счет взаимодействия между аминокислотами, образующими белок, на каждом шаге одни размерности пространства закрываются, а другие открываются для последующего перемещения. Путь движения становится изрезанным, и альтернативные варианты белка просачиваются по тонким проходам, пронизывающим области с низкой адаптивностью (рис. 2б).

Михаил Бурцев

1. Povolotskaya, Inna S., и Fyodor A. Kondrashov. 2010. Sequence space and the ongoing expansion of the protein universe. Nature (online 19 May 2010). doi:10.1038/nature09105.

2. Hubble, Edwin. 1929. A Relation Between Distance And Radial Velocity Among Extra-Galactic Nebulae. PNAS 3 (15): 168-173.