Смекни!
smekni.com

Мутации структуры белковоподобного сополимера Компьютерное моделирование (стр. 9 из 10)

В нашем исследовании шаги 2 –5 независимо повторяем 20 раз, начиная от различных случайных конформаций и тогда все результаты усредняются по этим расчетам, чтобы статистика была лучше. Каждую траекторию мы можем интерпретировать ряд последовательностей полученных по ходу эволюционного процесса, как различные ветви эволюции, получаемые от начльной конформации. Эти результаты могут быть важны для понимания основных возможностей эволюции последовательности.

Существует два основных различия в методике между алгоритмом предложенным нами и который использовался в статьях [23-25]. Во первых, наша вычислительная схема основана на динамических принципах, в то время как в методе, описанном статьях [23-25], используется стохастическая динамика. Грубо говоря, алгоритм дизайна первичной структуры цепей отбирает те желаемые последовательности, чьи соответствующие конформации имеют наименьшую потенциальную энергию. Ясно, что такой подход позволяет оптимизировать энергию данной конформации,в то время как в нашем подходе энергия не является ограничивающим параметром и может в принципе увеличиваться. Конечно, следует помнить, что наша модель молекулярной эволюции включает стохастическую составляющую. Во вторых, каждый шаг процедуры, использующей метод Монте Карло, является попытка парной замены, заключающаяся в случайном выборе двух звеньев и обмене их между собой (модель «точечных мутаций»). Сущность процедуры модификации, используемой в нашем эксперименте, является химическая модификация всех звеньев, окружённых растворителем. В реальном эксперименте это можно произвести при помощи растворённого реагента. Подчеркнём, что даже единичное модифицирование поверхности глобулы может резко изменять одномерную первичную последовательность цепи. Поэтому число получаемых последовательностей строго ограничено, фактически составляя ничтожную часть всех возможных последовательностей. Таким образом, данный подход существенно отличается по своей сути, физической природе, и также по его экспериментальной осуществимости. Также следует помнить, что последовательности, полученные при помощи этого подхода, не являются уникальными и нативными.

Так как при моделировании требуется существенное количество вычислении, наш анализ ограничивался только равновесными свойствами.

В проведённом компьютерном эксперименте было обнаружено, что в области малых значениях параметра eр происходит вырождение глобулы и образование структуры типа ²головастик², который состоит из плотного ядра и длинного хвоста. Также возможно образование длинной петли или двух ²хвостов².Можно предположить, что на начальном этапе эволюции глобулы образуются длинные петли. Затем одна из длинных петель вырождается в длинный хвост.[26]

На рис. 3.1. можно видеть типичную морфологии глобулы белково-подобного сополимера и структуру типа «головастик». Для количественного описания этого перехода было предложено ряд характеристик.


(а) (в)

Рис. 3.1. (а) Мицелоподобная структура, (в) структура типа ²головастик².

3.3. Методы анализа

Рассмотрим поподробнее характеристики, которые были предложены для описания перехода «глобула – головастик».

1. Среднеквадратичный радиус инерции.

Его можно рассчитать по формуле:

<R2g> = N-1

(rir0)2 (3.6)

где N – число частиц,

r0 – радиус вектор центра масс,

ri – радиус вектор i-й частицы

Этот параметр характеризует размер макромолекулы. Косвенным образом может характеризовать форму молекулы. Часто используют для изучению перехода клубок - глобула.

2.Длины «хвостов» .

Под «хвостом» понимают непрерывный участок Н или Р звеньев, который берёт начало с конца полимерной цепи. Так как в «головастике» длина хвоста достаточна велика, то вероятно это удачная характеристика для описания этого перехода. Однако, как будет показано в следующей главе, из-за недостаточного усреднения эта характеристика достаточно сильно флуктуирует.

3. Длины петель.

Подобно длинам хвостов – это также непрерывный участок Н и Р звеньев, однако этот участок не имеет начало с конца полимерной молекулы. Так в первичной структуре можно выделить достаточное число петель, то усреднение будет лучше и характеристика меньше флуктуирует во времени.

4. Размер заархивированного файла

характеристику можно объяснить следующим образом. Обозначим Н звенья как 0, а Р звенья - как 1. В результате первичную структуру сополимера можно представить как последовательность единиц и нулей. Такой цифровой код записывается в файл и подвергается архивированию. Размер заархивированного файла Lв, выраженным в байтах и характеризует первичную структуру, в частности, распределение в ней единиц и нулей. Мы использовали стандартный архиватор GZIP. Определение размера заархивированного файла показано на схеме в приложении 6.

Эта характеристика удобна тем, что при вырождении глобулы в «головастик» значение её резко уменьшается. Это обусловлено увеличением длин петель и «хвостов».

5. Индекс Шеннона. ( I )

Индекс Шеннона (Shannon’sindex) вычисляется по формуле

I = Nlog2N -

Nilog2Ni(3.7)

где Ni - количество элементов сорта i,

n - количество сортов элемента,

N - общее количество элементов,

Например в цепочке

10011111000000011110000001110111

имеется:

блоков длиной 1 - 2 штуки (N1=2)

блоков длиной 2 - 1 штука (N2=1)

блоков длиной 3 - 2 штуки (N3=2)

блоков длиной 4 - 1 штука (N4=1)

блоков длиной 5 - 1 штука (N5=1)

блоков длиной 6 - 1 штука (N6=1)

блоков длиной 7 - 1 штука (N7=1)

всего блоков различной длины - 9 штук

( N=2+1+2+1+1+1+1=9),

сортов блоков - 7 сортов (n=7)

Индекс Шеннона равен:

I = 9*log29 - (2*2*log22 + 7*1*log21 = 9*3.1699 - (2*2*1 + 7*1*0) = 24.5

Индекс Шеннона характеризует информационную энтропию.

Индекс Шеннона, размер заархивированного файла и длины петель зависят друг от друга. На рис. 3.2. и 3.3 можно видеть, что в билогарифмических координатах эти зависимости можно апроксимировать прямой.

Рис. 3.2. Зависимость размера заархивированного файла от длин Н- и Р- петель.

Из рисунков можно видеть, что LB = (Loop)m+ cons’t , где m может меняться от -0.45до –0.7.

Рис. 3.3. Зависимость размера заархивированного файла от индекса Шеннона.

Можно видеть, что эта зависимость имеет вид LB = In+ cons’t. Параметр n меняется в интервале от 0.63 до 0.7.

4. Результаты и обсуждение

Рассмотрим некоторые моменты методики эксперимента.

1. Число усреднений и длительность расчёта.

Рис. 4.1. Зависимость длин

H- петель от числа модификаций.

a – 20 усреднений, 1 млн. шагов

b – 40 усреднений, 1 млн. шагов.

c – 20 усреднений 2 млн. шагов.

Из рис. 4.1. видно, что кривые а и b незначительно отличаются друг от друга. Что касается продолжительности счёта, то увеличение его в два раза (кривая с) также сильно не влияет на результат. Таким образом, при проведении эксперимента достаточно 20 усреднений данных, и достаточное время для моделирования – 1 млн. шагов интегрирования.

Время между модификациями поверхности (t).

Рис. 4.2. Зависимость величины LB (a) и индекса Шеннона (b) от числа модификаций первичной структуры при различных t.

На рис. 4.2. можно видеть, что чем меньше значение t, тем ниже лежат кривые. Таким образом, при t = 2000 скорость молекулярной эволюции максимальна. При меньшем значении t необходимая релаксация структуры во временном промежутке между модификациями звеньев будет протекать не полностью. То есть в эксперименте мы устанавливаем параметр t равным 2000 шагов интегрирования.

В результате молекулярной эволюции происходит изменение как конформации молекулы, так и первичной последовательности цепи. Для изучения перехода "глобула - головастик" мы использовали ряд характеристик, описанные в разделе 3.3.

1. Радиус инерции

Рис. 4.3. показывает, что в процессе молекулярной эволюции происходит увеличение радиуса инерции. Можно видеть, что при eр< 0.2 увеличение радиуса инерции происходит достаточно сильно, что связано с вырождением глобулы и образованием длинного «хвоста». Величины радиусов инерции сильно флуктуируют во время эксперимента.


Рис. 4.3. Зависимость радиуса инерции и радиуса инерции звеньев Н от числа модификаций первичной структуры.

2. Длины «хвостов».

Рис. 4.4. Зависимость H- и P- «хвостов от числа перекрасок.

Из Рис. 4.4. видно, что чем меньше значение параметра eР, кривые зависимостей лежат выше. Если eР> 0.2, то кривые выходят на плато. В остальных случаях значение «длин» хвостов продолжают возрастать. Эта характеристика также ведёт себя нерегулярно.

2. Длины петель.