2) блок 12 содержит аминокислотные остатки из внутренней части (“сердцевины”) белка; пространственно они расположены вокруг главного функционального сайта;
3) блок 22 содержит по большей части аминокислотные остатки из “сердцевины” белка, расположенные дальше от главного функционального сайта; они играют структурную роль и , возможно, участвуют в передаче сигнала от лиганда к главному функциональному сайту;
4) блок 23 содержит большинство остатков, участвующих во взаимодействиях с лигандом; они могут быть расположены как в “сердцевине” белка, так и на его поверхности;
5) блок 33 содержит в основном позиции, расположенные на поверхности белка и участвующие во взаимодействии с лигандом, но не в передаче сигнала к главному функциональному сайту. Здесь также находится большинство “непокорных” (recalcitrant) позиций — позиций, для которых выравнивание является сомнительным.
Сигнал передается по такому пути: лиганд —> блок 23 —> блок 22 —> блок 12 —> блок 11 —> взаимодействие с G-белком.
Для исследования белковых семейств, состоящих из очень большого числа белков, предлагается анализ коррелированных мутаций (correlated mutation analysis, или CMA). Он используется для выяснения роли отдельных аминокислотных остатков в структуре и функциональной активности белка. СМА позволяет выявить группы (“сетки”) аминокислотных остатков, мутации которых происходят взаимосвязанно (а значит, для поддержания функциональной активности белка важно не столько положение отдельных аминокислотных остатков, сколько образуемая группой остатков структура в целом).
Основными входными данными для СМА являются множественные выравнивания, поэтому они делаются с учетом всех имеющихся экспериментальных данных и доступной на данный момент информации о трехмерной структуре белков. В процессе анализа учитываются только те части, пространственная укладка которых является общей для всех белков в данном выравнивании. Участки, где есть вставки и делеции, не анализируются.
В зависимости от целей в СМА применяются различные матрицы:
· для изучения структурных аспектов используются матрицы Dayhof (Dayhof-style residue similarity matrices);
· для изучения функциональных аспектов используется единичная матрица (identity matrix for residue similarities) — аминокислотные остатки или одинаковы, или различны; никаких промежуточных значений нет.
Степень сходства (correlation score) между позициями p и q вычисляется по следующей формуле:
n-1 n
С(p, q) = W(i, j) * ∑ ∑ δ(ip, iq, jp, jq),
p=1 q=p+1
где n — число белковых последовательностей в выравнивании. Пара чисел p и q пробегает все пары позиций в последовательностях i и j. ip, iq, jp и jq образуют две пары позиций (p, q) в двух последовательностях — i и j, соответственно. Функция δ такова, что
· δ(ip, iq, jp, jq) = 1, если ip = jpи iq = jqили ip ≠ jpи iq ≠ jq;
· δ(ip, iq, jp, jq) = 0, если ip = jp и iq ≠ jq или ip ≠ jp и iq = jq.
W(i, j) — вес (weight factor) пары последовательностей i и j, который вычисляется так:
n-1 n
W(i, j) = wi * wj / ∑ ∑ wk * wl,
k=1 l=k+1
где wi и wj — веса последовательностей i и j.
Следующий пример (таблицы 2 и 3 с пояснениями) иллюстрирует первую формулу. Для простоты все веса приняты равными 1,0.
Таблица 2.
№ последовательности | № позиции | ||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
1 | A | S | P | W | L | R | L |
2 | A | S | P | W | I | D | L |
3 | T | T | P | W | V | K | G |
4 | T | G | P | W | M | E | G |
Взяты 4 произвольные последовательности, из 7 аминокислотных остатков каждая.
Степень сходства С(1, 2) рассчитывается так:
n-1 n
С(1, 2) = (2 / n*(n-1)) * ∑ ∑ δ(1p, 1q, 2p, 2q) = 1/6 * (δ(ASAS) + δ(ASTT) + δ(ASTG) +
p=1 q=p+1
+ δ(ASTT) + δ(ASTG) + δ(TTTG)) = 1/6 * (1+1+1+1+1+0) = 0,84
Остальные степени сходства рассчитываются аналогично; их значения для указанных 10 пар позиций приведены в таблице 3.
Таблица 3.
p, q | 1, 2 | 1, 3 | 1, 4 | 1, 5 | 1, 6 | 1, 7 | 2, 3 | 3, 4 | 5, 6 | 6, 7 |
С(p, q) | 0,84 | 0,33 | 0,33 | 0,67 | 0,67 | 1,00 | 0,16 | 1,00 | 1,00 | 0,67 |
Если все попарные степени сходства в некоторой группе позиций превышают величину, принятую за точку отсчета (обычно 0,7 – 0,9), то эта группа называется “сетью” (network).
Позиции, в которых наблюдается консервативность у некоторых подсемейств внутри анализируемого семейства белков, называются “непокорными” (recalcitrant). Они не используются ни в одном из видов СМА. Эти позиции часто демонстрируют высокие степени сходства, но функционально важными не являются. В G-белок-связывающих рецепторах они часты в близких к трансмембранным спиралям внемембранных участках.
Высокая степень сходства каких-либо двух позиций может свидетельствовать об одной из трех вещей:
1) обе данные позиции полностью консервативны;
2) обе позиции вариабельны, причем имеют одинаковые вариабельность и энтропию;
3) мутации в этих позициях скоррелированы (аминокислотные остатки или вместе остаются консервативными, или вместе заменяются).
Пункт 1 — это частный случай пункта 3; а если число последовательностей в выравнивании очень велико, то и пункт 2 становится частным случаем пункта 3.
С помощью СМА в G-белок-связывающих рецепторах выделены 3 “сетки” (network):
· 1-ая состоит из наиболее консервативных аминокислотных остатков, участвующих в связывании G-белка;
· 2-ая состоит из остатков, участвующих в связывании лиганда;
· 3-ая состоит из остатков, участвующих в связывании и активации G-белка.
То есть “сетки” состоят из аминокислотных остатков, важных для связывания или с лигандом, или с G-белком. А “сеток”, связанных с передачей сигнала, нет. Это можно объяснить или отсутствием строгого давления эволюции на аминокислотные остатки, расположенные в центральной части белка; или тем, что важна структура центральной части в целом, и СМА не может выявить столь сложные взаимосвязи.
Выводы.
PG-рецепторы — это трансмембранные белки, поэтому количество гидрофильных аминокислотных остатков в PG-рецепторах меньше среднестатистического для белков человека, а количество гидрофобных — больше.
PG-рецепторы являются близкими гомологами друг для друга, при этом их аминокислотные последовательности заметно отличаются от аминокислотных последовательностей прочих белков. Максимальное сходство аминокислотных последовательностей наблюдается у представителей одного типа (или, если есть, подтипа) PG-рецепторов, принадлежащих разным организмам. Это позволяет предположить, что создание высокоселективных агонистов или антагонистов к какому-либо одному виду PG-рецепторов является осуществимой задачей. Также можно предположить, что эти агонисты/антагонисты будут одинаково действенны для данного вида рецептора, вне зависимости от вида животного. Это значит, что при разработке лекарств для человека можно будет проводить исследования на других животных.
Более далекие гомологи PG-рецепторов принадлежат, как и сами PG-рецепторы, к семейству А G-белок-связывающих рецепторов. Сходство аминокислотных последовательностей в данной группе невелико, и консервативными для 100 представителей этого семейства являются только 6 аминокислотных остатков.
Выполненное автоматически множественное выравнивание большого числа трансмембранных белков требует последующего ручного редактирования. При этом следует опираться на аминокислотные последовательности трансмембранных α-спиралей.
Выявлены мотивы, характерные для всех PG-рецепторов. Они частично совпадают с мотивами, свойственными большинству представителей семейства А G-белок-связывающих рецепторов.