Лев Павлович Овчинников, доктор биологических наук
Московский государственный университет им. М.В. Ломоносова
КРАТКАЯ ИСТОРИЯ ОТКРЫТИЯ мРНК
В начале 50-х годов Ф. Крик сформулировал свою знаменитую центральную догму молекулярной биологии, согласно которой генетическая информация от ДНК к белкам передается через РНК по схеме ДНК РНК белок. Процесс синтеза РНК на матрице ДНК называется транскрипцией, процесс синтеза белка на матрице РНК - трансляцией.
В 1956-1957 годах А.Н. Белозерский и А.С. Спирин показали, что при существенных различиях в нуклеотидном составе ДНК из разных организмов нуклеотидный состав суммарных РНК весьма сходен. На основании этих данных они пришли к сенсационному заключению о том, что суммарная РНК клетки не может выступать в качестве переносчика генетической информации от ДНК к белкам, поскольку не соответствует ей по своему составу. Вместе с тем они заметили, что при значительном изменении нуклеотидного состава ДНК при переходе от организма к организму наблюдается некоторый небольшой сдвиг нуклеотидного состава РНК в ту же сторону. Это позволило предположить существование минорной фракции РНК, которая полностью соответствует по своему нуклеотидному составу ДНК и которая может быть истинным переносчиком генетической информации от ДНК к белкам. Целенаправленный поиск такой РНК, предпринятый сразу в нескольких ведущих лабораториях мира, увенчался успехом в 1961 году. В том году С. Бреннер, Ф. Жакоб и М. Месельсон, с одной стороны, и Ф. Гро и Дж. Уотсон с сотрудниками - с другой, обнаружили ДНК-подобную РНК у бактерий. В течение последующих двух-трех лет аналогичная РНК была найдена в самых разных эукариотических организмах. Для ее обозначения был предложен термин "информационная, или матричная, РНК (мРНК)".
НЕКОТОРЫЕ СВОЙСТВА мРНК
По своим свойствам мРНК про- и эукариот существенно различаются. Бактериальные мРНК очень нестабильны. Период их полураспада составляет всего несколько минут. Эти мРНК обычно не претерпевают существенных модификаций после синтеза и могут начинать транслироваться в белок еще до полного завершения их транскрипции (рис. 1, а). Быстрое вовлечение в белковый синтез, с одной стороны, и нестабильность мРНК бактерий - с другой, обеспечивают оперативный контроль белкового синтеза на уровне транскрипции. Содержание мРНК в бактериальной клетке составляет всего 1-2% общего количества РНК в клетке.
Эукариотические мРНК довольно стабильны. Период их полураспада измеряется часами и даже сутками. Их транскрипция и трансляция пространственно разобщены. Транскрипция протекает в ядре, а трансляция - в цитоплазме (рис. 1, б ). Эукариотические мРНК синтезируются в виде предшественников и проходят в своем биогенезе стадию довольно сложного созревания, или процессинга. Процессинг включает в себя: 1) кэпирование 5'-конца, заключающееся в присоединении к этому концу мРНК так называемой шапочки (кэп-структуры), 2) полиаденилирование 3'-конца и, наконец, 3) сплайсинг - вырезание протяженных внутренних участков мРНК, так называемых интронов, и ковалентное воссоединение оставшихся фрагментов (экзонов) через обычную фосфодиэфирную связь (подробнее см. в статье: Гвоздев В.А. Регуляция активности генов при созревании клеточных РНК // Соросовский Образовательный Журнал. 1996. N 12. С. 11-18). Все перечисленные стадии созревания происходят в клеточном ядре, и в цитоплазму поступают уже процессированные, зрелые мРНК. Транспорт мРНК из ядра в цитоплазму осуществляется через ядерные поры. Все стадии процессинга и транспорта - регулируемые процессы. Время от начала синтеза мРНК до ее выхода в цитоплазму составляет не менее десяти минут. Высокая стабильность мРНК и сравнительно длительное время от начала синтеза до выхода в цитоплазму делают невозможной оперативную регуляцию белкового синтеза на уровне транскрипции. В связи с этим в клетках эукариот существенно возрастает роль регуляции белкового синтеза на посттранскрипционном уровне, а эукариотические клетки содержат значительно больше мРНК, чем бактериальные. Часть таких мРНК может находиться в неактивном (репрессированном или маскированном) состоянии.
мРНК прокариот очень часто являются полицистронными, то есть содержат информацию для нескольких полипептидных (белковых) цепей. Зрелые эукариотические мРНК, как правило, моноцистронны и кодируют только одну полипептидную цепь. Те части молекулы мРНК, в которых закодированы белки, называются транслируемыми областями. Однако помимо транслируемых областей в мРНК имеются достаточно протяженные последовательности, не кодирующие белок. Общая длина этих нетранслируемых областей порой может достигать или даже превышать длину транслируемых областей. Нетранслируемые области находятся на обоих концах молекул мРНК и соответственно называются 5'- и 3'-НТО. В прокариотических полицистронных мРНК имеются также внутренние межцистронные нетранслируемые области, располагающиеся между транслируемыми областями. Наряду с информацией о последовательности аминокислот в белке молекулы мРНК содержат информацию, определяющую их поведение в клетке (активность и время жизни, внутриклеточное распределение). Эта информация находится в основном в нетранслируемых областях мРНК.
ОБЩИЕ СВОЙСТВА ГЕНЕТИЧЕСКОГО КОДА, КОДОВЫЙ СЛОВАРЬ
Проблема кодирования в молекулярной биологии была впервые поставлена Г. Гамовым еще в начале 50-х годов, то есть задолго до открытия самой мРНК. Размышляя над тем, как линейная последовательность четырех различных нуклеотидов в нуклеиновой кислоте может определять последовательность двадцати разных аминокислот в белке, Гамов предположил, что генетический код является триплетным, то есть три соседних основания полинуклеотидной цепи (он оперировал с ДНК) однозначно определяют включение одной определенной аминокислоты в белок. Он же поставил вопросы и о других свойствах генетического кода: перекрываемости, запятых между кодонами, вырожденности.
В 1961 году Ф. Крик и С. Бреннер экспериментально показали, что делеция (вырезание) одного нуклеотида, дающая мутантный фенотип, может быть скомпенсирована вставкой нуклеотида вблизи делеции. Этот результат можно было объяснить предположив, что при делеции нуклеотида происходит сдвиг рамки считывания за местом делеции, и это приводит к полному изменению смысла всей последующей информации; при вставке одного нуклеотида вблизи места делеции происходит восстановление первоначальной рамки считывания и первоначального смысла закодированной информации. Таким образом, описанные эксперименты доказали, что генетический код не содержит запятых. В опытах с делециями и вставками Крик, Барнет, Бреннер и Уотс-Тобин (1961) также подтвердили, что код является триплетным или кратен трем, поскольку три делеции или три вставки нуклеотидов давали нормальный фенотип.
Опыты Г. Виттманна по замене единичных оснований в РНК вируса табачной мозаики показали, что такие замены могут приводить к замене только одной аминокислоты в белке. Это однозначно свидетельствовало в пользу того, что генетический код не перекрывается. Другими словами, каждое основание РНК входит в состав лишь одного триплета (кодона).
Полная расшифровка генетического кода, проведенная М. Ниренбергом и С. Очоа, была закончена к 1966 году. Она показала, что 61 из 64 возможных триплетов мРНК кодируют одну из двадцати стандартных аминокислот, включающихся в белок (рис. 2). Таким образом, генетический код оказался сильно вырожденным, и многие аминокислоты кодируются двумя или более кодонами. Три триплета, не участвующие в кодировании аминокислот, - UAA , UAG и UGA - оказались сигналами на окончание синтеза белка (сигналами терминации).
Перенос генов из одних организмов в другие и их последующая успешная экспрессия доказали, что генетический код почти всегда универсален. Другими словами, все живые организмы от бактерий до млекопитающих пользуются в основном одним и тем же кодовым словарем. (Правда, некоторые нарушения универсальности генетического кода обнаружены в митохондриях.)
Все триплеты в транслируемой области мРНК, которые кодируют определенную аминокислоту, узнаются в рибосомах специфическими молекулами тРНК с присоединенными к ним аминокислотами. Точность узнавания весьма велика за счет существования специальной системы коррекции ошибок. Терминирующие кодоны узнаются специальными белками - факторами терминации. Надежность узнавания этих триплетов не столь высока, и иногда терминирующий триплет может прочитываться как кодон аминокислоты. Для повышения надежности процесса терминации терминирующие кодоны обычно дублируются. Первым при этом, как правило, выступает кодон UAA (основной терминирующий триплет), а вслед за ним на очень близком расстоянии в той же рамке считывания следует один из запасных терминирующих триплетов - UAG или UGA .
После расшифровки генетического кода в 1966 году вопрос о том, что и как закодировано в мРНК, казалось, был полностью исчерпан. С течением времени, однако, стало очевидно, что это далеко не так.
ПЕРЕКОДИРУЮЩИЕ СИГНАЛЫ В мРНК ИЛИ ВТОРОЙ ГЕНЕТИЧЕСКИЙ КОД
Инициирующий кодон узнается только в определенном контексте. Если мы зададим вопрос, можно ли, имея перед собой последовательность нуклеотидов какой-либо мРНК, таблицу генетического кода и зная, что трансляция мРНК идет в направлении от 5'- к 3'-концу, а белковая цепочка растет от N-конца к C-концу, написать последовательность аминокислот белка, закодированного в этой мРНК, то будем вынуждены ответить на поставленный вопрос отрицательно. Исходя из перечисленных сведений нельзя определить, с какого места мРНК мы должны начать переводить ( транслировать ) последовательность нуклеотидов в последовательность аминокислот.
Рис. 2. Кодовый словарь. Красным цветом отмечены терминирующие кодоны
Уже очень давно стало ясно, что начало трансляции мРНК ( инициация ) не совпадает с началом самой мРНК. Свидетельством этому служат полицистронные мРНК бактерий, в которых инициация белкового синтеза происходит на каждом цистроне, а также присутствие в мРНК про- и эукариот 5'-концевых нетранслируемых последовательностей. Вместе с тем установлено, что биосинтез белка как у про-, так и у эукариот всегда начинается с одной и той же аминокислоты - метионина. Можно было бы предположить, что трансляция информации, закодированной в мРНК, начинается с первого от 5'-конца метионинового кодона, которым является триплет AUG . Для многих моноцистронных эукариотических мРНК это действительно так, хотя бывают и исключения. Однако это совсем не так для полицистронных мРНК бактерий, где инициация часто происходит на триплетах AUG, отстоящих очень далеко от начала мРНК. Этим триплетам может предшествовать большое количество других AUG, на которых инициации не происходит. Более того, оказалось, что первый метионин в белке в некоторых случаях включается не на метиониновом кодоне AUG, а на кодоне GUG , который соответствует в таблице генетического кода аминокислоте валину.