Репликация ДНК (см. Лекцию 15) является передачей генетической информации на молекулярном уровне. Как известно, генетическая информация кодируется в молекуле ДНК с помощью четырех нуклеотидов: аденина (А), тимина (Т), гуанина (Г) и цитозина (Ц), располагающихся в определенной последовательности. Основными же рабочими молекулами клетки являются белки, которые состоят из 20 природных, или канонических аминокислот. Набор аминокислот абсолютно одинаков, универсален для всей живой природы. Отличие живых организмов друг от друга состоит в том, в какой именно последовательности расположены аминокислоты в молекулах соответствующих белков, то есть первичной структурой белковых молекул. Аминокислотные последовательности всех белков определяются последовательностью звеньев в одной из двух комплементарных цепочек ДНК. Каким же образом информация, записанная четырехбуквенным алфавитом ДНК, переводится в двадцатибуквенный алфавит белковых молекул?
Решающий вклад в решение этой проблемы внес американский учѐный русского происхождения Георгий Гамов в 1954 году. Гамов предположил, что образующие первичную структуру белка канонические аминокислоты кодируются сочетаниям трех нуклеотидов, то есть посредством триплетного генетического кода. Расшифровка этого кода была закончена в 1967 году. Определѐнные тройки нуклеотидов (кодоны) соответствуют определенным аминокислотам. Так, например, кодон ГЦА соответствует аланину, а ГГЦ – глицину, кодон УУУ – фенилаланину, кодон АУГ – метионину, а кодон ГУГ – валину (СМ. Таблицу 17.1). Так как нуклеотидов существует 4 сорта, а аминокислот – 20 сортов, то всего может существовать 43 = 64 различных кодона. Следовательно, не всякому кодону соответствует аминокислота. Существуют кодоны, выполняющие специальные функции. Они служат как бы стоп-сигналами, обозначающими конец аминокислотной цепи. Однако, таких кодонов немного (УАА, УАГ, УГА). Подавляющее большинство кодонов соответствует какой-либо аминокислоте, причем каждой аминокислоте соответствует не один, а несколько кодонов. То, какой аминокислоте будет соответствовать данный кодон, определяют первые два нуклеотида. Каков третий нуклеотид, не так уж важно, то есть, хотя код и триплетный, главную смысловую нагрузку несет дуплет, стоящий в начале кодона. Иными словами, триплетный код является, по существу, квазидублетным. Существует правило вырожденности: если два кодона имеют два одинаковых первых нуклеотида и их третьи нуклеотиды принадлежат к одному классу (пуринов или пиримидинов), то они кодируют одну и ту же аминокислоту. Специальных терминирующих кодонов не существует. Эту роль в определенных условиях играют кодоны АУГ и ГУГ, обычно отвечающие аминокислотам метионину и валину. Генетический код представлен в таблице 17.1.
Таблица 17.1. Генетический код
Кодон | Кислота | Кодон | Кислота | Кодон | Кислота | Кодон | Кислота |
УУУ | Phe | УЦУ | Ser | УАУ | Tyr | УГУ | Cys |
УУЦ | УЦЦ | УАЦ | УГЦ | ||||
УУА | Leu | УЦА | УАА | Окончание | УГА | Окончание | |
УУГ | УЦГ | УАГ | Окончание | УГГ | Trp | ||
ЦУУ | Leu | ЦЦУ | Pro | ЦАУ | His | ЦГУ | Arg |
ЦУЦ | ЦЦЦ | ЦАЦ | ЦГЦ | ||||
ЦУА | ЦЦА | ЦАА | Gln | ЦГА | |||
ЦУГ | ЦЦГ | ЦАГ | ЦГГ | ||||
АУУ | Ile | АЦУ | Thr | ААУ | Asn | АГУ | Ser |
АУЦ | АЦЦ | ААЦ | АГЦ | ||||
АУА | АЦА | ААА | Lys | АГА | Arg | ||
АУГ | Met или Начало | АЦГ | ААГ | АГГ | |||
ГУУ | Val | ГЦУ | Ala | ГАУ | Asp | ГГУ | Gln |
ГУЦ | ГЦЦ | ГАЦ | ГГЦ | ||||
ГУА | ГЦА | ГАА | Glu | ГГА | |||
ГУГ | ГЦГ | ГАГ | ГГГ |
Где Gly - глицин; Ala - аланин; Val - валин; Leu - лейцин; Ile - изолейцин; Met
- метионин; Phe - фенилаланин; Trp - триптофан; Pro - пролин; Ser - cерин; Thr - треонин; Cys - цистеин; Tyr - тирозин; Asn - аспарагин; Gln - глутамин; Asp - аспарагиновая кислота; Glu - глутаминовая кислота; Lys - лизин; Arg- аргинин; His - гистидин. Кодон АУГ, определяющий аминокислоту метионин, обычно подаѐт сигнал к началу синтеза белка. Терминирующие кодоны УАА, УАГ и УГА подают к завершению синтеза белковой молекулы.
По современным представлениям, ген - это часть молекулы, которая содержит информацию об аминокислотной последовательности одной белковой молекулы. Как же ген порождает белок? Этот процесс называется матричным синтезом и происходит в два этапа. На первом этапе, который называется транскрипцией, специальный фермент узнает последовательность нуклеотидов, расположенную между генами (эту последовательность называют промотором) и, двигаясь вдоль гена, снимает с него копиюматрицу в виде молекулы РНК. Молекула РНК сходна по химическому составу с ДНК, однако в отличие от последней, РНК представляет собой одиночную цепочку и содержит не тимин, а урацил. Копирование гена происходит по тому же комплементарному принципу, что и репликация ДНК, только ту роль, которую в ДНК выполняет тимин, в РНК играет урацил. Синтез РНК ведется только по одной из двух комплементарных цепей гена. Энзим, ведущий процесс транскрипции, называется РНКполимеразой. РНК-полимераза снимает с гена, участка длинной молекулы ДНК, копию-матрицу в виде молекулы РНК.
Эта матрица используется на втором этапе синтеза белка, в процессе под названием трансляция. Именно здесь, на решающем этапе, вступает в силу генетический код. Процесс трансляции очень сложен, в нем принимает участие множество «действующих лиц». Главное из них - рибосома, сложнейший агрегат, построенный из полусотни различных белков и имеющий собственную молекулу РНК, которая в отличие от матричной, или информационной, мРНК, называется рибосомной РНК, или рРНК. Рибосома - это своеобразная молекулярная вычислительная машина, переводящая тексты с нуклеотидного языка ДНК и РНК на аминокислотный язык белков, программой для которой служит генетический код. Роль переводчика выполняет РНК еще одного вида - транспортная РНК. В клетках эукариотов матричная РНК проходит через оболочку ядра, чтобы попасть в цитоплазму, где рибосома синтезирует белок. Сами аминокислоты не могут распознать последовательность кодонов матричной РНК. Именно молекула транспортной РНК отвечает за доставку нужных аминокислот в новую полипептидную цепь. Для этого тРНК должна выполнить две задачи: выбрать нужные аминокислоты и распознать соответствующие кодоны в мРНК. Первая стадия синтеза белка называется инициацией. Первая аминокислота прикрепляется к транспортной РНК по принципу комплементарности в соответствии с информацией, «записанной» в матричной РНК. В этом процессе участвуют мРНК, тРНК и два участка рибосомы. На второй стадии, который называется стадией наращивания цепи, к исходной аминокислоте присоединяются друг за другом остальные аминокислоты, пока полипептидная цепь не будет завершена. Заканчивается процесс синтеза белка, когда специальный терминирующий кодон достигнет определенного участка рибосомы. Готовый белок освобождается и от тРНК, и от рибосомы. В процессе трансляции и после нее белок подвергается нескольким изменениям, которые определяют его трехмерную форму и свойства, отвечающие его функциям в клетке.