Блистающий мир белков и пептидов (стр. 2 из 5)

Названия белков и пептидов очень разнообразны. Первоначально они давались в то время, когда их химическая (первичная) структура была еще неизвестна. Целым группам белков присваивались названия на основании того, как они растворяются в воде, в растворах нейтральных солей, щелочах, кислотах и органических растворителях (например, протамины). Однако затем наибольшее число названий конкретных веществ пептидной природы стало даваться по названию органа, ткани или целого животного, из которого они были выделены, и по функциям, которые они осуществляют.

Первый олигопептид был получен из мясного фарша и поэтому назван карнозином (от лат. carnis – мясо), название одного из основных белков мяса – миозин – произошло от соответствующего греческого слова мышца (mаj – миос), а целая группа белков гистонов получила название от греческого слова (istТ – хистос), характеризующего понятие ткань. Примером использования названия животного служит ксенопсин, выделенный из африканской гладкой шпорцевой лягушки Xenopus laevis. Функциональные свойства олигопептидов отражены, например, в названиях брадикининов и тахикининов, вызывающих, в частности, ослабление (брадикардию) и усиление (тахикардия) сердечной деятельности. Некоторые названия хранят в себе название места, где они были открыты: ригин – в г. Рига (Латвия), а тафтцин – в Тафтском университете (США). Можно долго рассказывать об этой стороне предмета, поскольку число подобных примеров исчисляется тысячами. Однако предоставим это занятие профессиональным историкам науки для всестороннего и полного исследования, тем более что такие работы уже ведутся. Приведем только один пример.

В 30-е гг. прошлого века в Германии из сыворотки крови лошади было выделено вещество, которому присвоили название субстанция P (P – латинское). В то время еще не умели определять химическую структуру достаточно больших пептидов, однако было ясно, что соединение относится к этому классу веществ. Через многие годы, когда автора работы уже не было в живых, встал вопрос: а почему вещество названо именно так? В результате появилось три гипотезы, ни одна из которых до сих пор однозначно не обоснована. Первая из них очевидна – получен белок, и в названии использована первая буква от английского слова protein. Вторая основана на том, что вещество было получено в виде порошка, а это английское слово (pouder) также начинается с буквы «P». И, наконец, третья обращена к родному языку автора, на этом языке (немецком) животное, из которого выделено вещество (лошадь), пишется как das Pferd.

Белки и пептиды изучают чуть ли не во всех странах, а в научных публикациях на эту тему используются языки многих народов мира. Если в начале истории изучения этих веществ большинство научных работ считалось престижным писать на французском или немецком, то примерно с середины прошлого века стало традицией публиковать работу с новыми принципиальными результатами наряду с родным языком также и на английском.

Элементарная математика и информатика

Удивительная простота изначальной (первичной) структуры белков и олигопептидов позволяет провести простой математический анализ всей совокупности этих веществ. Сначала зададимся вопросом: сколько существует разных линейных последовательностей, в написании которых может быть использовано 20 стандартных аминокислотных остатков? Если через N обозначить число возможных последовательностей, а через n – количество аминокислотных остатков в молекуле, то ответ на поставленный вопрос даст простейшая алгебраическая формула, учитывающая все возможные повторы аминокислотных остатков в одной структуре:

N = 20ⁿ.

Из этой формулы следует, что максимальное число разных дипептидов (n = 2) равно 400, трипептидов (n = 3) – 8000, тетрапептидов (n = 4) – 160 000 и т.д. Как видим (см. табл. 2), число N очень быстро растет с увеличением n.

Тогда возникает другой вопрос: а каковы возможности живого организма вмещать в себя подобную информацию? Первичная информация содержится в нуклеотидной последовательности, и хотя она и очень велика, но все же не беспредельна. В табл. 3 представлены числа азотистых оснований суммарной ДНК у представителей разных царств живой природы. Первое, на что обращаешь внимание, это то, что общее их число варьирует в очень широких пределах и может составлять от 107 (некоторые бактерии и грибы) до 1011 (представители растений и рыб). При этом заметим, что царь природы человек отнюдь не является чемпионом среди других представителей живой природы, довольствуясь лишь примерно одним миллиардом азотистых оснований. Но для нас главное не это. Оказывается, самый большой геном не может вместить информацию даже о всех возможных декапептидах (n = 10) при их последовательном расположении.

Действительно, при n = 10:

N = 6,7х10¹¹.

Eсли учесть то, что для записи одного аминокислотного остатка требуется 3 азотистых основания и что часть генома, шифрующая аминокислотные последовательности, составляет только несколько процентов от его общей величины, то получается, что самый большой геном способен вместить информацию о последовательности, состоящей лишь из 109 аминокислотных остатков. Таким образом, в нем может содержаться информация менее чем об 1% всех возможных декапептидов. А ведь известны белки, содержащие более 5 тыс. аминокислотных остатков!

Отсюда следует вывод о том, что в природе встречаются далеко не все линейные комбинации аминокислотных остатков. Это подтверждается компьютерным анализом встречаемости различных линейных комбинаций аминокислотных остатков во всех расшифрованных белках и пептидах (более 100 тыс.). Полученные результаты приведены в табл. 2, данные которой свидетельствуют о том, что в случае уже октапептидов (N = 8) встречается всего лишь около 0,001% возможных линейных комбинаций аминокислотных остатков.

А способна ли математика ответить на вопрос, решенный лингвистикой: можно ли дать строгое определение разницы между малыми и большими пептидами (олигопептидами и полипептидами)?

Попробуем на него ответить, пользуясь рассуждениями нашего великого соотечественника математика Андрея Николаевича Колмогорова (1903–1987), о малых (S) и больших (G) числах, свидетелем которых автор был на семинаре в МГУ в 1958 г. Колмогоров рассуждал примерно так. Числа существуют в определенной системе счисления. Система счисления, которой пользуется подавляющая часть человечества, определяется величиной m = 10. Тогда в рамках этой десятичной системы малыми числами будут такие, которые удовлетворяют условию m > S > m, а большие – G >> m. Иными словами, малые числа по порядку величины сравнимы с величиной основания системы счисления, а большие – во много раз ее больше.

К олигопептидам и белкам эти рассуждения можно применить таким образом. Еще раз отметим то, что эти вещества формируются из 20 различных аминокислотных остатков, а обычно используемые числа образуются из 10 разных цифр. Следовательно, аналогом числовой системы счисления в нашем случае является аминокислотная система счисления, характеризующаяся величиной 20, и тогда малыми (олигопептидами) можно считать такие, в которых содержится меньше или больше 20 аминокислотных остатков (20 > n > 20), а большие – у которых их много больше 20, (n >> 20). Этот критерий является чисто математическим, но, однако, его можно увидеть и в физических, и в биологических свойствах олигопептидов и белков. Но об этом будет рассказано в последующих разделах.

Физика

Ключевыми в физике являются понятия: взаимодействия, энергия и энтропия (энтропия – мера неупорядоченности, соответственно, отрицательная энтропия – мера упорядоченности). При физическом взгляде на мир белков и олигопептидов такие понятия также весьма полезны. Молекулы этих веществ осуществляют взаимодействия как внутри себя, так и с внешними молекулами. Эти взаимодействия направлены на приобретение отдельными молекулами или молекулярными комплексами определенной пространственной формы (конфигурации или конформации), что в конкретных условиях приводит к достижению минимально возможной энергии при данной степени неупорядоченности. А многообразие возможных аминокислотных последовательностей лежит в основе неизмеримо большего многообразия их возможных пространственных (уже не линейных) конфигураций.

Как сравнительно просто устроена ДНК! Для выявления общей конфигурации ее двойной спирали в начале 1950-х гг. прошлого века Уотсону и Крику, любившим обсуждать научные проблемы за чашечкой кофе, потребовалось выпить не очень много литров этого тонизирующего напитка, чтобы разобраться в принципах ее организации. Так же немного времени (всего несколько лет) потребовалось на то, чтобы в 1960-х гг. описать, как последовательность азотистых оснований ДНК и РНК транслируется (переводится) на язык аминокислотных остатков. Казалось бы, еще немного (допустим, не более 10 лет), и общие принципы формирования пространственной структуры белков будут найдены! Эта проблема получила название проблемы фолдинга (от англ. fold – складывать). Однако нет. Прошло уже почти 40 лет после начала экспериментального получения пространственных структур белков, а тайна пока не раскрыта. Тысячи ученых разных специальностей в течение этого времени (некоторые – всю свою творческую жизнь) пытались создать универсальный метод построения пространственной структуры белков по аминокислотной последовательности (как это делается в природе), но никому данную проблему не удалось решить даже для одной не слишком протяженной структуры. Почему?

В отличие от ДНК или РНК, составленных всего из 4 стандартных азотистых оснований, белки включают 20 стандартных аминокислотных остатков. Это приводит к тому, что число возможных взаимодействий пар остатков (как соседствующих, так и удаленных) оказывается более чем на порядок больше, чем для пар азотистых оснований. А в пространстве могут взаимодействовать одновременно не 2, а более остатков, в результате чего число возможных взаимодействующих единиц на много порядков больше. Важным является то, что весь остов транслированной пептидной цепи является прочным, поскольку все его элементы, включая и пептидную связь, объединены сильными химическими (ковалентными) связями. Химическая связь между удаленными аминокислотными остатками бывает, как правило, только одного типа в случае, когда два остатка цистеина образуют дисульфидную связь (S-S связь, или S-S мостик). Это существенно уменьшает число возможных конфигураций. Однако и при наличии S-S связей у протяженных полипептидов остается еще много степеней свободы для образования разных конфигураций, и, кроме того, существует немало белков, в которых остатки цистеина отсутствуют.