Смекни!
smekni.com

Методика анализа содержания текстов (стр. 2 из 10)

Сообщение о событии дается через два дня после свершения

Сообщение о событии дается через три-семь дней

Сообщение касается события, произошедшего более семи дней назад или, как указывается в сообщении «недавно», «за последние дни» и т.д.

Сообщение касается события, дата свершения которого не указывается

Сообщение касается вневременных проблем

Видно, что анализировалась именно местная пресса тридцать лет назад - если бы мы исследовали сегодняшние информационные телевизионные выпуски, мы должны были бы предусмотреть репортажи с места события «минута в минуту» и т.д. А поскольку это были местные издания, где существовал такой способ донесения информации до читателя, как перепечатка из центральных газет, появление здесь градации с оперативностью трех-четырехдневной давности было вполне оправданным.

Когда же мы стали анализировать информационную телевизионную программу «Время» [4]- средство (и канал) заведомо более оперативное - мы пошли по пути дальнейшей дифференциации событийного повода материалов, идущих с грифом «сегодня». Это могли быть информационные сюжеты о событиях, которые можно было предсказать за много десятилетий до этого дня: так называемые календарные, юбилейные или знаменательные даты - «сегодня исполнилось 200 лет со дня рождения А.С. Пушкина». С другой стороны, это могут быть сюжеты типа «сегодня проснулся вулкан X » - событие, обладающее для аудитории максимумом неожиданности, непредвиденности, непредсказуемости. Потребовались и более «оперативные» градации для телевизионной программы общенационального масштаба.

Если проследить за нашей логикой описания оперативности, то она состояла в том, что мы описали ее с помощью разных типов, разных случаев оперативности. По сути дела, взамен однородного понятия оперативности мы создали группировку, классификацию разных типов оперативности. Как в жизни - для каких-то случаев достаточно сказать о спортсмене, что он хороший стрелок, а для каких-то - в спорте - надо уточнить, что он стрелок 3-го, 2-го, 1-го разряда, мастер спорта и т.п.

Обратимся с этой точки зрения к географии события, а значит, и материала о нем. Известно, что в нашей стране больше тысячи городов, десятки тысяч сел. Мы не можем в анализе состояния дел с «географической сбалансированностью», - если бы это было категорией анализа в нашем будущем исследовании, - отражаемой источником информации об объекте, говорить о представительности каждого населенного пункта: точек на карте слишком много. Сбалансированность такого рода может и должна подразумевать пропорциональную представительность достаточно крупных регионов. Каких? Существует множество типологий такого рода, исследователь вправе выбрать любую. Страна разделена на области, края, республики - можно говорить о представленности таких понятий; существует деление на экономико-географические районы: Урал, Западная Сибирь и т.д. - можно на этом построить анализ; существует типология поселений: село, малый город, средний город, крупный город - можно говорить о представленности таких типов поселений.

Мы, по сути дела, сделали следующий шаг в построении, создании программы исследования, который состоит в конструировании категориальной сетки, или, если выразиться на языке терминов, в классификации, группировке семантического пространства категории анализа. Если говорить образно, то речь идет о создании своеобразного сита, через которое будет просеяно реальное содержание исследуемого информационного источника, где роль ячеек будут выполнять типы, разные модификации категории анализа.

Обращаясь к конкретным текстам газет, радио и телевидения, исследователь оперирует рабочей единицей анализа. В нашем пример из исследования о расовой дискриминации таковой будет «персонаж» - фигура белого рабочего или темнокожего с определенной степенью квалификации.

Исследование оперативности материалов имеет в качестве единицы анализа отдельный материал, поскольку мы связываем оперативность с оперативным поводом целого материала.

Когда речь идет о географии информационного материала, единицей анализа может быть отдельный материал. Но вот большие газетные, теле- и радиоматериалы содержат (могут содержать) информацию о разных населенных пунктах, о разных областях и т.п. Значит, надо предусмотреть объем информации для анализа, который будет мельчайшей единицей текста, где может появиться упоминание искомого нами географического типа. Прежде всего это может быть слово, равное названию пункта (края, города, области, региона); это может быть абзац, посвященный нужной нам «географической точке»; это могут быть более пространные текстовые фрагменты, содержащие разговор о нужной нам точке.

Вот здесь пора вспомнить, что анализ содержания выясняет объем внимания к какой-либо проблеме в рамках отдельного материала, газетного номера, радио- или теледня, недели, месяца и любых других временных отрезков в деятельности анализируемого канала [5].

Оперируя словом как единицей анализа, мы подсчитываем, сколько слов приходится на тот или иной тип в избранной нами типологии, подразумевая, что чем больше слов посвящено какому-либо типу, тем больше внимания коммуникатор уделяет именно этому типу.

Оперируя абзацем как единицей анализа, мы подсчитываем, сколько абзацев посвящено тому или иному типу в избранной нами типологии, подразумевая, что чем больше абзацев, тем больше внимания уделяется тому или иному типу... При этом мы игнорируем разницу в размерах абзаца, рассматривая их равноправно, расцениваем, что несмотря на разницу в размерах, каждый из них прочитывается как бы на «едином дыхании», а с точки зрения автора текста - выражает законченную мысль.

Оперируя фрагментом текста как единицей анализа, мы должны измерить, какой фрагмент текста - крупный или небольшой - соответствует определенному типу поселения, Значит, появляется нужда в пространственных - если речь идет о газете, или временных - если речь идет о радио- или телепередачах, мерах. Можем измерять эти куски строками, площадью или минутами, секундами. То есть здесь мы выходим на новые, по сравнению со счетом по нарастающей, соответствующей количеству фиксируемых нами признаков, единицы измерения.

Таким образом, если сгруппировать все возможные методики оперирования с текстом, с учетом разных единиц анализа и разных единиц измерения, то грубо их можно разделить на две группы:

1. Единицей анализа выступает признак материала, который характеризует его в целом: это может быть оперативность - фиксация (или нефиксация) временной вехи события, которое выступает событийным поводом появления материала в потоке информации; это может быть функциональная принадлежность материала: так, радио- и телевизионные материалы традиционно делятся на информационные, развлекательные, учебные, утилитарные (реклама и справки).

Группировка может быть другой [6], но важно, чтобы каждый материал относился к той или иной группе по своей доминирующей функции.

В таких случаях признак должен описываться конечным числом случаев, или, иначе говоря, исследователь должен предусмотреть все возможные модификации признака, чтобы каждый материал был зачислен к той или иной модификации. Есть какие-то материалы, в которых бессмысленно искать оперативный повод, например художественные. Значит, исследователь предусматривает графу «материалы, не классифицируемые по этому признаку» и относит туда эти материалы [7]. Есть материалы, для которых трудно вычленить главную функцию - значит, исследователь предусматривает графу «трудно классифицируемые случаи» и относит туда этот материал. В совокупности все анализируемые материалы распадаются на столько групп, сколько модификаций признака предусмотрел исследователь. Подсчет количества материалов в каждой группе, принадлежащей одной модификации, происходит двумя способами, которые мы тут подытоживаем:

а - подсчитывается само количество этих материалов, выражаемое натуральным рядом чисел (от одного до n ...);

б - подсчитывается сумма площадей (в газете) или эфирного времени (на радио и телевидении) материалов, приходящихся на каждую группу.

2. Единицей анализа выступает отдельный фрагмент текста: слово, персонаж, суждение, абзац, или нетвердо фиксируемый отрезок текста, совпадающий с определенной темой. Во всех случаях речь идет о довольно ограниченном наборе слов, персонажей, суждений, который интересует исследователя.

Их появление в тексте фиксируется уже значительно большим числом способов:

а - возможность подсчета количества упоминаемых в тексте слов, персонажей, суждений, тем и т.п. сводится к таким вариантам (разберем эти варианты для самого простого случая, когда единицей анализа является слово):

подсчитывается общее число упоминаний каждого слова;

подсчитывается количество предложений, абзацев, которые могут содержать искомые слова;

подсчитывается число материалов, в которых встретилось хотя бы одно искомое слово.

б - подсчитывается сумма площадей (в газете) или эфирного времени (на радио и телевидении) отрезков текста, содержащих нужное слово:

тут мельчайшей частицей выступают законченные, «оформленные» единицы площади (абзац, страница микрофонной папки с радио- и телематериалами) с нужным словом, сумма которых и подсчитывается;

суммируются площади материалов в целом, если они содержат хотя бы одно искомое слово.

Здесь следует ввести понятие единицы контекста. Обсудим его на примере подсчета слов, соответствующих категориальной сетке исследователя. Слово живет в рамках предложения; более сложной пространственной единицы, состоящей из нескольких предложений, если все они обеспечивают законченное суждение; абзаца и, наконец, материала в целом. Если объектом исследования служит небольшой текстовой материал, имеет смысл подсчитывать все количество упоминаний слова. Но иногда при больших объемах исследователи устанавливают единицы контекста, и тогда употребление хотя бы одного искомого слова в рамках абзаца считается равноценным его неоднократному употреблению в этом же абзаце. Более того, упоминание слова в рамках материала иногда фиксируется как равнозначное неоднократному его употреблению в рамках этого же материала.