Смекни!
smekni.com

Изучение исторических источников на основе применения количественных методов и новых информационных технологий (стр. 2 из 3)

В 1990-е гг. возникли новые отрасли источниковедения - компьютерное и информационное источниковедение. Компьютерное источниковедение – это дисциплина, ориентированная на разработку методов анализа исторических источников с помощью компьютера, принципов их формализации и представления в электронной форме, а также общих подходов использования информационных и компьютерных технологий в историческом исследовании. Информационное источниковедение основано на изучении источника в свете теории информации.

Использование компьютеров и компьютерных сетей привело к появлению нового типа источников – электронных документов. Многие из них становятся “мультимедийными”, объединяя текст, компьютерную графику, видео, анимацию, звук. Для обработки подобных “мультимедийных” источников необходимо использовать новые методы анализа, и даже специальный язык (HTML-язык и гиперссылки на цитируемые WWW сервера).

Различные виды программного обеспечения предоставили возможность историкам изучать источники по следующим направлениям:

· статистические пакеты (STATISTICA для Windows, Statgraphics, SPSS и др.) позволили анализировать как статистические источники, так и источники с неколичественной информацией с помощью широкого набора математико-статистических методов.

· электронные таблицы (Lotus 1-2-3, Quattro Pro, Excel и др.) дали возможность эффективно работать со статистическими источниками, которые представлены в форме таблиц.

· системы управления базами данных (DBASE, FoxPro, Paradox и др.) позволили обрабатывать статистические источники, структурированные массовые источники, имеющие единый формуляр (метрические книги, личные дела, анкеты и др.), текстовые (нарративные) источники, изображения.

· текстовые редакторы и процессоры предоставили возможность проводить различные операции с текстами исторических источников.

· графические редакторы, а также новые компьютерные технологии (мультимедийные системы), основанные на использовании сканеров, видеотехники, оптических лазерных дисков (CD-ROM), позволили хранить и анализировать изобразительные источники.

· программы компьютерного картографирования и географические информационные системы (Atlas*GIS, ARC/INFO, MapInfo и др.) дали возможность воссоздавать и обрабатывать картографические источники.

"Микрокомпьютерная революция" также способствовала привлечению к анализу источников систем искусственного интеллекта (баз знаний, экспертных систем, когнитивных компьютерных моделей понимания текста, фреймовых систем и др.), в которых были смоделированы знания историков-профессионалов.

В 1990-е годы в количественном и компьютерном анализе источников наметились следующие основные тенденции. Были продолжены, начатые с 1977 г. Л.В. Миловым и Л.И. Бородкиным, источниковедческие исследования, посвященные атрибуции повествовательных источников XII–XVIII вв. На основе анализа статистики парной встречаемости грамматических классов слов были предприняты попытки установить авторство "Повести временных лет", "Слова о полку Игореве", "Писем к Фалалею" (XVIII в), определить "стилевые портреты" автора "Слова о законе и благодати" митрополита Иллариона, Кирилла Туровского, Ивана Пересветова, князя А. Курбского, царя Ивана Грозного.

С помощью пакета прикладных программ, разработанного Е.В. Злобиным, была произведена атрибуция "Записок" члена общества "Соединенных славян", декабриста И.И. Горбачевского. В результате статистического анализа, основанного на подсчете частоты встречаемости служебных слов в предложении, был сделан вывод, что автором "Записок" был другой, анонимный автор.

Такими же методами Е.В. Злобиным и А.В. Быстровым было проанализировано предсмертное письмо Б.В. Савинкова с целью установления его авторства. По версии А.И. Солженицына автором письма был агент ОГПУ Я. Блюмкин, бывший левый эсер, прославившийся участием в покушении на немецкого посла Мирбаха в 1918 г. Сравнительному анализу подверглись художественные произведения "То, чего не было", "Конь вороной", статьи и письма Б.В. Савинкова, две записки Я. Блюмкина и предсмертное письмо. Использование количественных методов в сочетании с содержательным анализом источника, позволили сделать вывод, что Я. Блюмкин не мог написать за Б.В. Савинкова его предсмертное письмо.

Украинская исследовательница И.О. Тарнопольская методом диграммной энтропии, который позволяет определить статистические связи между буквами и частоту встречаемости каждого символа в тексте в процентном соотношении, а также парную встречаемость этих символов, исследовала исторический труд XVII в. "Синопсис", созданный в Киево-Печерской Лавре и приписываемый И. Гизелю. Расхождения в коэффициентах диграммной энтропии позволили сделать вывод, что в создании "Синопсиса" принимали участие четыре автора.

Вторым направлением обработки текстовых источников стало использование метода контент-анализа для выявления скрытого смысла текста источника или характеристики мировоззрения, психологических черт и менталитета автора источника. Например, А.В. Быстров использовал компьютерный контент-анализ мемуаров о Б.В. Савинкове для составления его психологического портрета и характеристики его поведения в момент гибели. Подсчет частоты встречаемости в мемуарах современников психологических оценок Б.В. Савинкова (наиболее частые оценки "живой", "артистичный", "обаятельный") позволил сделать вывод о том, что Савинков принадлежал к истероидному (артистическому) психологическому типу. Поэтому он сам являлся организатором своей гибели, будучи "режиссером" и "исполнителем" самоубийства 7 мая 1925 года. Тем самым предположение А.И. Солженицына о том, что Савинков был выброшен охранниками в лестничный пролет внутренней Лубянской тюрьмы не нашло своего подтверждения. Работы А.В. Быстрова дают пример плодотворного сочетания количественных и психологических методов обработки исторических источников.

Метод контент-анализа был значительно усложнен В.И. Тихоновым при обработке личных дел граждан, лишенных избирательных и других социальных прав в 20-е гг., т. н. "лишенцев". С помощью специально разработанной методики статистической категоризации были выделены 80 категорий по таким направлениям, как утверждение трудового и отрицание "нетрудового" статуса, сетования на нелегкую жизнь и оправдание "нетрудовой" деятельности. Затем при помощи статистического пакета SPSS была проведена автоматическая группировка и методом кластер-анализа были выделены 5 типов заявлений лишенцев, в которых группировались общие представления лишенцев о том, кто в СССР достоин избирательных прав (люди занимающиеся "общественно-полезным трудом", не использующие наемный труд, получавшие "нетрудовые доходы" в незначительном количестве и др.). Затем методом дискриминантного анализа заявлений лишенцев были выявлены общие и особенные черты принятия решений чиновниками избирательных комиссий Москвы об отказе или восстановлении гражданских прав. Был сделан вывод о том, что восстановление в правах проходило в силу хозяйственных причин, однако бывшим крупным торговцам, священникам и представителям эксплуататорских классов в восстановлении всегда отказывалось.

Третьим направлением применения количественных методов стала обработка массовых источников методами многомерного статистического анализа. Например, российский ученый С.Г. Кащенко с помощью методов анализа вариационных рядов, выборочного метода и корреляционного анализа исследовал массовые источники по реформе 1861 г. Санкт-Петербургской, Псковской и Новгородской губерний – уставные грамоты, выкупные акты и др. С.В. Воронкова применила корреляционный и кластерный анализ к массовым источникам по истории промышленности России начала ХХ века – промышленным переписям 1900, 1908 и 1910–1912 гг. Количественный анализ позволил исследователям уточнить выводы традиционной историографии по проведению реформы в северо-западных губерниях России в 1861 г. и развитию российской промышленности в 1900–1912 гг.

Белорусский историк А.Г. Кохановский на основании обработки методами многомерного статистического анализа опубликованных итогов переписи 1897 г., данных поземельных переписей 1877 и 1905 гг., военно-конских переписей 1888 и 1900 гг. и других статистических источников провел изучение социально-классовой структуры народонаселения Беларуси во второй половине XIX в. Исследователь выделил 20 количественных признаков, фиксирующих удельный вес основных социальных групп населения Беларуси, и осуществил анализ взаимосвязей между ними методами корреляции и регрессии. Интерпретация матрицы коэффициентов корреляции позволила сделать вывод о слабости социальной мобильности сельскохозяйственного населения Беларуси в конце XIX в. и незначительном уровне воздействия процесса капитализации на социальную структуру деревни. Анализ регрессионных моделей позволил выделить результирующие (зависимые) признаки: удельный вес занятого в промышленности населения, сельских жителей, занятых несельскохозяйственными промыслами, грамотного населения и др. С помощью метода главных компонент (разновидности факторного анализа) было проведено сравнительное изучение 35 белорусских уездов и выделено три основных фактора, влияющих на социальную структуру населения. На завершающем этапе работы был использован агломеративно-иерархический метод кластерного анализа, который позволил выделить 4 региональных типа уездов, близких между собой по социально-классовой структуре. Применение методов многомерного статистического анализа дало возможность проранжировать уезды по уровню их социального развития.