Смекни!
smekni.com

Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белков (стр. 5 из 7)

Поскольку заранее не известно, какие из базисных белков содержат элементы, отсутствующие у исследуемого белка, и спектры которых необходимо исключить из исходного набора для улучшения результатов, рассматриваются все возможные комбинации из исходного набора 16 базисных спектров. Эта процедура выполняется в следующем порядке. Сначала из исходного набора исключаются поочередно по три базисных спектра на каждом шаге, а ортогональные базисные спектры строятся на основе оставшихся 13 исходных базисных спектров. Сравнение результатов, полученных для различных наборов из 13 базисных белков, выявляет один или два белка, которые являлись причиной отклонений коэффициентов

и их суммы от условий (1) и (2). Эти белки исключаются из исходного набора, и процедура повторяется до тех пор, пока не будут получены удовлетворительные результаты.

Критериями удовлетворительного решения, соответствующего оптимальному набору базисных спектров, являются следующие условия:

1. Сумма коэффициентов

должна находиться в диапазоне от 0.96 до 1.05 (или, по крайней мере, от 0.90 до 1.10).

2. Значение содержания произвольной структурной формы в исследуемом белке (

) должно быть выше - 0,05.

3. Воспроизведение анализируемого спектра на основе выбранного набора базисных спектров должно быть лучше, чем при использовании полного их набора.

4. Более предпочтительным является набор, содержащий большее число базисных спектров.

5. Более предпочтительными являются те белки, спектры которых ближе к анализируемому спектру.

На практике в большинстве случаев удовлетворительных результатов удается достичь при исключении из исходного набора всего трех или четырех белков, причем среднеквадратичная ошибка при воспроизведении анализируемого спектра составляет меньше 0.2 единицы De. Если несколько наборов базисных белков оказываются удовлетворительными в одинаковой степени, то результаты, полученные на их основе, усредняются.

В заключение можно отметить, что метод "выбора переменных" является мощным средством анализа спектров КД белков в ситуациях, когда другие распространеннные методы дают заведомо неверные результаты.

Сравнение различных методов анализа спектров КД.Поскольку все методы анализа спектров КД имеют чисто эмпирический характер, каждый из них нуждается в экспериментальной проверке на белках с известными рентгеноструктурными данными. Обычно подобная проверка проводится на белках, включенных в базисный набор для данного метода. При этом белки поочередно исключаются по одному из этого набора, а их спектры анализируются на основе спектров оставшихся белков. После этого результаты, полученные для каждого типа вторичной структуры, сравниваются со значениями, полученными при рентгеноструктурном анализе, с помощью подсчета коэффициента корреляции между этими двумя наборами данных, определяемого следующим выражением:

.(1.2.22)

Здесь

и
- экспериментальный и рассчитанный наборы данных, n - число белков в базисном наборе. Значения коэффициента корреляции r лежат в диапазоне от - 1 до 1, причем значеия r, близкие к 1, свидетельствуют об успешном предсказании, характеризующимся достаточно высокой точностью. Значения r, близкие к 0 или - 1, говорят о случайном совпадении или полном несоответствии рассчитанных и экспериментальных данных.

Ниже приведены значения коэффициентов корреляции для четырех рассмотренных методов: метода "эталонных спектров" [2,3], метода "регуляризации" [4], метода "ортогональных спектров" [5,6] и метода "выбора переменных" [7]:

метод диапазон, коэффициент корреляции r
нм a b­¯ b­­ b­¯+­­ b-изг. Ост.
[2,3] 190-240 0.85 - - 0.25 -0.31 0.46
[4] 190-240 0.96 - - 0.94 0.31 0.49
[5,6] 190-260 0.98 0.40 0.00 -0.27 0.18 0.24
[7] 190-260 0.95 0.57 0.47 0.45 0.54 0.69
[4] 178-260 0.96 0.23 0.39 0.12 0.51 0.64
[5,6] 178-260 0.98 0.55 0.63 0.54 0.30 0.61
[7] 178-260 0.97 0.78 0.67 0.76 0.49 0.86

1.3 Работа с пакетом программ STRUCTUREпо анализу спектров КД белков

Пакет программ STRUCTUREразработан в институте белка РАН (1991-1992 К.С. Василенко). Он предназначен для анализа спектров кругового дихроизма белков и определения их вторичной структуры. Алгоритм анализа спектров основан на методах, описанных выше. Пакет STRUCTUREсостоит из следующих программ и вспомогательных файлов:

- STRUCTURE (файл structur.exe) - программа, обеспечивающая интерфейс для всех программ пакета, позволяющая также создавать и редактировать файлы данных в универсальном для всех программ формате.

- CONTIN (файл contin.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].

- PROVCD (файл provcd.exe) - программа, осуществляющая проведение статистического теста для программы CONTIN.

- DEF_CLASS (файл def_clas.exe) - программа, определяющая тип третичной структуры белка.

- CDESTIMATE (файл cdestima.exe) - программа, определяющая вторичную структуру белка методом "эталонных спектров" [3].

- VARSELEC (файл varselec.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" с процедурой "выбора переменных" [7].

- RUN.BAT - командный файл, используемый для запуска программ пакета в условиях недостаточного объема оперативной памяти.

- *.DAT - файл, содержащий спектр КД белка, а также данные о его вторичной структуре (если они известны).

- *.GRP - файл, содержащий список базисных спектров КД (принадлежащих одной из базисных групп).

- *.STR - файл, содержащий набор структурных типов (элементов вторичной структуры белка).

После запуска файла structur.exeна экране появляется главное меню программы, состоящее из следующих пунктов:

1. File - создание и редактирование файлов данных;

2. Group - создание и редактирование групп базисных спектров КД белков;

3. Calculate - выбор метода анализа, анализируемого спектра, группы базисных спектров, запуск вычислений и просмотр результатов;

4. Options - выбор набора структурных типов;

5. Setup - изменение цветового оформления окон программы;

6. Quit - выход из программы.

В нижней части экрана располагаются три окна, содержащие информацию об анализируемом спектре КД (Protein), а также о выбранных для анализа группе базисных спектров (Group) и наборе типов вторичной структуры белка (Structures).

Создание и редактирование файлов данных. Создание и редактирование файлов данных осуществляется с помощью команд меню File/Createи File/Editсоответственно. В файл необходимо внести следующую информацию:

- Комментарий длиной не более 45 символов (пункт меню Comment).

- Идентификатор длиной не более 7 символов, который становится именем файла и автоматически приобретает расширение.dat (пункт меню Identificator).

- Содержание в белке (относительные доли) различных типов вторичной структуры по данным рентгеноструктурного анализа (пункт меню Structuredata). Эти данные необходимы только в случае использования вводимого спектра в дальнейшем в качестве базисного.

- Диапазон и шаг по длинам волн, а также сам спектр КД (пункт меню Spectrum). Для программы CDESTIMATEдиапазон анализируемого спектра не должен быть шире, чем 240 - 190 нм, а шаг должен быть равен 1 нм или больше. Для программы CONTINчисло точек в анализируемом спектре не должно превышать 51. Для программ CONTIN, VARSELECи PROVCDдиапазон анализируемого спектра не должен быть шире диапазона базисных спектров, а шаг должен совпадать с шагом базисных спектров.

После ввода всей перечисленной выше информации необходимо сохранить ее с помощью пункта меню Save. При необходимости можно построить введенный спектр КД на экране в графическом виде с помощью пункта меню View.

Команды меню File/Loadи File/Deleteиспользуются соответственно для добавления новых спектров в список рабочих спектров, запоминаемых программой, и для удаления из него ненужных спектров. Для добавления нового спектра с помощью команды Load необходимо указать имя файла, в котором он хранится (предварительно его надо записать в текущий каталог). При удалении какого-либо спектра из списка с помощью команды Deleteсоответствующий ему файл не удаляется, поэтому его всегда можно будет включить обратно в список с помощью команды Load.

Создание и редактирование групп базисных спектров. В программе STRUCTUREуже существует 6 предопределенных групп базисных спектров, соответствующих различным методам анализа спектров КД. Эти группы имеют следующие имена: