Мангейм Дж. Б., Рич Р.К.

Политология: Методы исследования

М.: Издательство “Весь Мир”, 1997. – 544 с.

Красным шрифтом в квадратных скобках обозначается конец текста

на соответствующей странице печатного оригинала указанного издания

9. КОНТЕНТ-АНАЛИЗ

Очень часто политолог может узнать об индивидах, социальных группах, учреждениях и даже о странах много нового, если он изучит связанные с ними информационные источники. Много ли информации о политических предпочтениях и способностях кандидатов содержится в предвыборных плакатах и в предвыборных сводках новостей? Может ли изучение внутреннего циркуляра крупной корпорации помочь обнаружить тайные планы ее администрации, направленные на подкуп представителей иностранных правительств, с которыми она собирается иметь дело? Насколько точна информация, публикующаяся в “Вестнике конгресса” (“Congressional Record”), о влиятельности того или иного американского сенатора? Отражают ли российско-американские дипломатические коммюнике состояние общественного восприятия тех изменений, которые происходят в российско-американских отношениях?

Лучший ответ на эти и другие вопросы может дать непосредственное изучение различных информационных источников. В целом эти источники можно подразделить на 3 категории: источники внутреннего происхождения (т.е. составленные изучаемым нами индивидом, учреждением или правительством) и внутренне ориентированные (например, служебные циркуляры, отражающие сам процесс принятия решения); источники внутреннего происхождения, но внешне ориентированные (такие публикации, как “Вестник конгресса”, в которых информация намеренно подается таким образом, чтобы сформировать у людей вполне определенный имидж источника, и которые, следовательно, могут как точно отражать, так и затемнять процесс и результаты принятия решений) и, наконец, источники внешнего происхождения, но внутренне ориентированные (например, предвыборная агитация, предоставляющая реципиенту исходный материал для принятия решений). Каждая из этих категорий источников может быть в большей или меньшей степени доступна или полезна для исследователя, но при этом все они в [c.269] равной мере обеспечивают возможность более глубокого проникновения в суть политического поведения.

Наиболее адекватным методом выявления такой возможности является контент-аналнз, т.е. систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника. Контент-анализ снабжает нас методом – вернее, серией методов, – с помощью которого мы можем обобщать те или иные материальные проявления поведения и отношений различных типов политических субъектов. В этой главе мы обсудим, когда следует применять контент-анализ, каковы основные приемы этой методики, как интерпретировать ее результаты и каковы пределы ее применения.

Контент-анализ может быть использован для ответа на исследовательские вопросы всегда, если имеется какой-то материальный носитель информации, так или иначе относящейся к интересующим нас политическим субъектам, и когда у исследователя есть доступ к этому информационному источнику. Примеры таких носителей – книги, памфлеты, журналы, газеты, фонограммы, аудио– и видеозаписи, фотографии, протоколы собраний или заседаний, правительственные документы, внутриведомственные циркуляры, фильмы, дипломатические коммюнике и инструкции, политические плакаты, карикатуры и лозунги, тексты речей и даже письма и дневники. Некоторые из этих носителей могут быть предельно подробными и точными (как, например, стенографический отчет о заседании конгресса) в отличие от других (например, от повестки дня того же самого заседания). Многие из них никак не зависят от исследовательского процесса (как, например, газетные публикации об изучаемом нами лице или организации), но есть и такие, которые исследователь должен воспроизвести сам (например, видеозаписи информационных телепрограмм). Однако все источники данных для контент-анализа имеют одну существенную черту: наличие материального носителя информации. Во всех случаях, когда он существует или может быть воссоздан, допустимо использование контент-анализа.

Первый шаг в подготовке к контент-анализу состоит в определении той совокупности сообщений, которую мы [c.270] будем изучать. Здесь перед нами открывается ряд возможностей. То, какая из них оптимальна, будет зависеть от конкретного исследовательского вопроса. Например, если объектом нашего исследования являются политические сюжеты в американской романистике XX в., то мы вправе определить искомую совокупность как все романы (тип сообщений), вышедшие из-под пера американских авторов (продуцент сообщений) и опубликованные в США (место распространения сообщений) в период между 1 января 1900 г. и сегодняшним днем (время появления сообщений). Если же нас интересует то, как освещалась в газетах определенная предвыборная кампания, искомая совокупность будет включать в себя все предвыборные газетные публикации (тип сообщений) размером в два и более газетных столбца (объем сообщений), опубликованные в ежедневных газетах (частота появления сообщений), которые были доставлены подписчикам (способ распространения сообщений) 6-го, 7-го и 8-го избирательных округов штата Огайо (место распространения сообщений) в период с 1 сентября по 5 ноября соответствующего года выборов (время появления сообщений).

Точно так же если мы хотим исследовать динамику развития напряженности в отношениях между США и Угандой в 70-е годы, то искомая совокупность может быть определена как все дипломатические послания (тип сообщений), которыми обменялись правительства США и Уганды (стороны, участвующие в процессе коммуникации) в течение определенного периода времени.

В каждом из этих примеров совокупность сообщений, подлежащих изучению, определяется с помощью набора заданных критериев, которым должно отвечать каждое сообщение. К этим критериям относятся: тип сообщений (романы, газетные публикации, дипломатические ноты), тип продуцента сообщений, стороны, участвующие в процессе коммуникации (отправитель, или получатель, или они оба), а также место распространения, частота появления, минимальный объем или длина, способ распространения и время появления сообщений. При необходимости могут быть использованы и другие критерии, однако те, которые перечислены нами выше, встречаются в большинстве исследований, где применяется контент-анализ. Первоочередная задача при подготовке к контент-анализу [c.271] состоит в том, чтобы выбрать среди этих критериев те, которые имеют наиболее непосредственное отношение к конкретному исследовательскому вопросу.

После того как мы определили совокупность сообщений, перед нами встает задача решить, какие из сообщений мы будем изучать наиболее детально. Поскольку подлежащие анализу случаи (сообщения) зачастую ограничены по числу и относительно хорошо доступны и поскольку контент-анализ в целом менее дорогостоящ (в расчете на каждое сообщение), чем другие методы (в особенности опрос), иногда удается подробно исследовать каждый случай (сообщение) из данной совокупности, т.е., по сути, произвести опись всех случаев. Именно возможность изучения большого количества случаев является одной из главных привлекательных черт контент-анализа как исследовательского метода. Чаще, однако, случается, что даже контент-анализ вынужден опираться на ограниченную выборку, взятую из более крупной совокупности.

Ввиду того что для документов, газетных статей и пр. обыкновенно существуют указатели или перечни, публикуемые в центральных изданиях и потому доступные для исследования, в контент-анализе из выборочных методов чаще всего применяются простой случайный отбор и систематический случайный отбор. Но даже тогда, когда необходимо выборочное обследование, размеры выборок для контент-анализа – благодаря доступности и относительной дешевизне исходных данных – обычно значительно превосходят те, которыми вынуждены довольствоваться другие виды исследования. Результатом этого, конечно же, является уменьшение ошибки выборки и повышение уровня надежности наших обобщений.

И наконец, готовясь к проведению контент-анализа, мы должны принять решение о единице измерения, или – если использовать более общеупотребительный термин – о единице анализа. В контент-аналитическом исследовании единица анализа – это просто отдельный элемент или признак того сообщения, которое мы собираемся изучать, обсчитывать или оценивать. Простейшим элементом сообщения является слово, и оно может быть использовано в контент-анализе наиболее непосредственным образом. [c.272]

Например, желая ответить на вопрос “Насколько интересовали проблемы мира во всем мире Р. Рейгана, Дж. Картера, Дж. Форда и Р. Никсона?”, мы могли бы взять выборки из выступлений каждого президента и подсчитать, сколько раз в тексте появится слово “мир” (и, возможно, некоторые другие, связанные с этим слова). Отвечая на вопрос “Какая страна – Израиль, Египет, Сирия или Саудовская Аравия – занимает наиболее миротворческую позицию по вопросам ближневосточного конфликта, если судить по выступлениям ее представителей в ООН в период с 1975 по 1990 г.?”, мы снова могли бы, взяв записи всех таких выступлений, подсчитать частоту появления слов типа “мир”, “братство”, “компромисс” и т.п. Таким образом, метод состоит в том, что устанавливаются определенные ключевые слова и подсчитывается частота их употребления в сообщениях.

Однако даже в столь простой процедуре надо следить за тем, чтобы избежать по меньшей мере двух характерных ошибок. Во-первых, следует помнить, что оперирование нестандартизированными мерами может приводить к смещениям в результатах. Если за рассматриваемый период времени представители Израиля в своих выступлениях произнесли 100 тыс. слов, причем интересующие нас ключевые слова были упомянуты ими 50 раз, а представители Египта произнесли 200 тыс. слов, включая 100 упоминаний соответствующих ключевых слов, то, исходя из этого, можно прийти к двум разным заключениям в зависимости от того, стандартизированы или нет наши показатели. Если мы просто подсчитаем общее число упоминаний ключевых слов, то у нас получится, что египтяне выказали вдвое большую заинтересованность в мирном урегулировании конфликта, чем израильтяне. Если же, однако, мы стандартизируем нашу меру так, чтобы с ее помощью можно было определять долю всех ключевых упоминаний (допустим, в расчете на каждую тысячу слов), то в итоге мы сможем заключить, что обе стороны одинаково заинтересованы в улаживании конфликта. Какой из этих подходов правильнее? Это основной вопрос при операционализации переменных, и ответ на него достигается успешнее всего, если более внимательно присмотреться к тому, как была изначально концептуализована исследовательская проблема. Дело в том, что использование даже [c.273] такого на вид конкретного показателя, как число произнесенных ключевых слов, может быть чревато определенной двусмысленностью. Исследователь должен видеть эту двусмысленность и уметь с нею справляться, поскольку принятые (или, наоборот, упущенные) в связи с этим решения могут оказать существенное влияние на окончательные выводы.

Вторая возможная ошибка, связанная с грубо прямолинейным подсчетом слов, состоит в том, что одно и то же слово может употребляться в самых разных контекстах, изменяющих его значение. “Мы стремимся к миру, но...”, “Арабское братство никогда не допустит...”, “О компромиссе не может быть и речи...” – при отсутствии каких-либо средств контроля такие упоминания слов “мир”, “братство”, “компромисс” будут сочтены упоминаниями в позитивном смысле, а это – самое меньшее – приведет к завышению оценки степени заинтересованности соответствующей стороны в достижении мирной договоренности. Если подобного рода употребления достаточно часты, они могут в конечном итоге совершенно нас дезориентировать. Поэтому когда мы беремся считать слова, то это следует делать с учетом контекста.

Тут у нас имеется по меньшей мере две возможности. С одной стороны, мы можем использовать мнения арбитров, или кодировщиков, т.е. членов исследовательской группы, в задачу которых входит прочтение и оценка контекстов ключевых слов с точки зрения их позитивности, негативности или нейтральности. Обычно, прежде чем будет достигнуто окончательное решение, каждое упоминание должно быть прочитано не менее чем двумя кодировщиками, оценки которых должны быть согласованы. (Позже мы еще вернемся к этому вопросу.) Подобные оценки контекста позволяют впоследствии подсчитать числовое соотношение позитивных и негативных упоминаний.

Другой возможный путь интерпретации отдельных слов в контексте (хотя это дает всего лишь частичное решение проблемы) состоит в том, чтобы добавить к рассмотрению вторую единицу анализа – тему. Тема – это некоторое вполне определенное сочетание слов или понятий, воплощенное во фразе, в предложении или даже в абзаце. Фактически, подсчитывая темы, мы занимаемся поиском упоминаний в тексте объектов обсуждения, например [c.274] в виде фраз “холодная война”, “проблема беженцев”, “государственное социальное страхование”, “христианское поведение”. Данная процедура является вариантом подсчета слов – но вариантом улучшенным в том отношении, что в состав тем входят пояснительный текст и слова-модификаторы (наречия, прилагательные), сопровождающие употребление конкретного слова и помогающие установить его значение.

Однако и в этой процедуре есть своя трудность. Дело в том, что хотя такой анализ действительно проясняет контекст употребления отдельных слов, но происходит это за счет значительного усложнения всей процедуры. Ведь одна и та же тема может упоминаться по-разному и с помощью самых разных словосочетаний. Иногда это – тонкий намек, почти или совсем лишенный тех эксплицитных признаков, по которым мы опознаём данную тему. Упоминание о “холодной войне”, например, вполне может быть завуалировано миротворческими словами о разрядке, а упоминание о христианском доброчестии может быть замаскировано националистической риторикой. Можно ли подобные слова и риторику считать ключевыми? Содержат ли они в себе данную тему или нет? На эти вопросы непросто ответить. Попытки сделать это заставляют приходить к четким, но ограниченным определениям, к формулировке целого ряда строго формализованных правил принятия решения (разрешающих, например, производить подсчет только по эксплицитным, заданным некоторым списком упоминаниям темы), которые делают наши результаты, возможно, более надежными, но одновременно и менее содержательными.

Третий элемент, часто используемый в исследованиях с применением контент-анализа, – это собственно предмет как таковой, рассматриваемый в целом. Каков процент книг, пропагандирующих социализм, опубликованных в США в 1935 году? Какому кандидату в президенты в 1992 г. симпатизировало наибольшее количество редакций газет? Как письма, написанные Ричардом Никсоном после того, как он ушел со своего поста, отличаются от писем, написанных ранее? В каком из этих случаев мы обрабатываем несущий информацию блок как некую целую единицу и изучаем его общие, всеохватывающие характеристики. Какой конкретный вопрос рассматривается в [c.275] этом случае? Отражаются ли определенные ценностные установки или пристрастия? При рассмотрении таких вопросов притупляется острота взгляда, необходимого при анализе более мелких структур. Неизбежным становится присвоение обобщающих определений, но именно в силу этих причин их анализ обычно легче выполнить, чем анализ слов или тем, в том смысле, что исследователю приходится делать меньше запросов. И это действительно так, поскольку можно оперировать переменными достаточно нейтрального уровня, – уровня, на котором события (то есть происшествия заметные, яркие) часто более очевидны и на котором оценки более достоверны.

Предметное изучение употребления слов и тем в последнее время стало легче проводить благодаря развитию компьютерных баз данных, таких, как LEXIS/NEXIX. Предположим, к примеру, что мы хотим узнать, как часто Дж. Буш сравнивал Саддама Хусейна с Гитлером в течение месяца, предшествующего войне 1991 г. в Персидском заливе. Используя NEXIS, мы можем сделать запрос на полнотекстовое исследование всех статей в “Нью-Йорк Тайме” (и любых других газетных статей и текстов передач широкого вещания), в которых слова “Дж. Буш”, “Саддам Хусейн” и “Гитлер” встречаются в хронологический период, выбранный для изучения. Тогда в соответствующем файле, с учетом особенностей пакета и языка, можно будет написать команду примерно следующего вида:

((George Bush) OR (President Bush) AND ((Saddam Hussein) w/10 Hitler)) AND (Date = September 1990)

Это длинное выражение задает команду, по которой в любой статье, опубликованной в сентябре 1990 г., будет опознан, во-первых, поименованный мистер Буш, а во-вторых, мистер Хусейн, если его имя отстоит в тексте от слова “Гитлер” не более чем на 10 слов в любую сторону. Такой запрос позволяет нам, кроме всего прочего, проверить (1), упоминалось ли имя мистера Буша вместе с его титулом чаще, чем без титула в то время, как становилось все яснее, что кризис будет разрешен военным путем (поскольку было бы возможно предположить ситуацию, что средства массовой информации неуловимо будут повышать весомость статуса президента, по мере того как [c.276] нация приближается к войне); (2) по сравнению с другими политиками мистер Буш лидировали или отставал по числу использования имени “Гитлер” в различных аналогиях, или (3) бесконечное число других гипотез, относящихся к формулированию восприятия конфликта обществом.

Результаты обобщенного анализа во многих отношениях не менее содержательны, чем результаты компонентного. Какой факт важнее: то, что египтянами в ходе одного из выступлений в ООН семь раз было упомянуто слово “мир”, или же то, что ими была произнесена в целом миротворческая речь? Более важно, посылали ли США в Ирак ноту с четырьмя открытыми упоминаниями об интервенции, тремя скрытыми намеками на неспособность разоружиться и двумя острокритическими намеками на военную экспансию, или что США послали ноту, которая может быть охарактеризована как вздорная по тону? В контент-анализе иногда – и всегда по недостатку средств – мы рискуем не увидеть леса за деревьями или , по аналогии, значение информации вообще за частями, ее составляющими. По этой причине мы должны быть очень и очень осторожными в выборе измеряемой единицы анализа и избрать наиболее перспективную и благоприятную для проведения исследования в целом.

Приняв решение о совокупности сообщений, выборке и единице анализа, мы можем приступать к самому анализу. Контент-анализ, основанный на исследовании слов, тем и сообщений, сосредоточивает внимание исследователя на содержании сообщения, на том, о чем в нем говорится. Таким образом, собираясь подвергнуть анализу эти элементы, мы должны уметь предвидеть их смысл и уметь определять каждое возможное наблюдение в соответствии с нашими ожиданиями.

На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа мы должны создать своего рода словарь, в котором каждое наше наблюдение получит определение и будет отнесено к соответствующему классу. Допустим, например, нас интересует проблема идентификации в кубинских школьных учебниках [c.277] для 6-го класса всех упоминаний об американцах и США. Прежде чем приступать к анализу, мы должны определить, что же является в данном случае ключевым словом (словосочетанием). Должны ли мы обращать внимание только на слова “американец”, “американский” и “США”? Если да, то мы рискуем упустить из виду упоминания, состоящие из таких экспрессивно-оценочных терминов, как “агрессоры-янки”, “империалисты с Севера”, “гринго”, “захватчики”, “вторжение в Гуантанамо”, “беззаконный режим Вашингтона”. Более того, некоторые такие фразы могут употребляться в нескольких разных смыслах, из которых лишь один относится непосредственно к США. Рассмотрим следующие условия задач по арифметике:

1. Если кубинский народ владеет 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у него 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется кубинскому народу на пропитание?

2. Если африканцы владеют 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у них 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется африканцам на пропитание?

Допустим, что оба случая упоминания “неоколониалистских агрессоров” мы будем считать относящимися к США, тогда обе задачи будут восприняты нами как антиамериканские по смыслу. Однако тот, кто знаком с новейшей историей и идеологией Кубы, сочтет ключевым лишь первое из этих упоминаний, в то время как второе будет им интерпретировано скорее как выпад в адрес белого правительства ЮАР.

Проблема состоит в том, что мы должны предвидеть не только упоминания, которые нам могут встретиться, но и элементы их контекстуального употребления, а для этого мы должны разработать детальную систему правил оценки каждого случая употребления. Эта задача обычно решается посредством пилотажа подлежащей анализу совокупности сообщений (т.е. с помощью выявления на материале небольшой выборки сообщений тех типов ключевых упоминаний, которые с наибольшей вероятностью могут встретиться в последующем, более полном анализе) в сочетании с арбитражными оценками контекстов и способов употребления терминов. Здесь, как и в формальном [c.278] анализе, о котором речь пойдет ниже, предпочтительнее иметь дело с наблюдениями не одного, а нескольких исследователей.

Образцы фраз из газетных передовиц в поддержку

Лучшее из того, что мог бы дать процесс отбора

Более трудной является задача, заключающаяся в необходимости приписывания ключевым упоминаниям конкретных оценок, – когда мы должны решить, приводится ли данное упоминание в позитивном или негативном смысле, “за” или “против” интересующего нас объекта и т.д., а также когда нам надо ранжировать ряд упоминаний соответственно силе их оценок (т .е. в соответствии с тем, какое из них самое положительное, какое следующее за ним по положительности и т.д.). При этом мы нуждаемся в показателях достаточно тонких, которыми можно было бы измерять не только настроения политических субъектов, но и силу этих настроений. Ситуация подобного рода отражена в табл. 9.1, где в обобщенном виде перечислены возможные формы предвыборной поддержки газетой некоторой кандидатуры. Если целью является определить, какая из газет активнее всего поддерживает эту кандидатуру, то наша непосредственная задача будет [c.279] заключаться в том, чтобы решить, как следует ранжировать эти утверждения в соответствии с той силой поддержки, которую каждое из н их отражает.

Существует несколько методов, облетающих принятие такого решения. Два наиболее известных способа ранжирования – это метод Q-сортировки и шкалирование путем парного сравнения. Подобно методу шкалирования по Тёрстоуну, описанному в гл. 8, они опираются на суждения группы арбитров о значении или силе (интенсивности) некоторого термина с той только разницей, что здесь арбитры могут отбираться из числа как отправителей, так и получателей сообщения, как из группы ученых, хорошо знакомых с предметом изучения, так и из населения в целом, а также из числа самих исследователей. Оба эти метода отличаются друг от друга и от метода Тёрстоуна по тем задачам, которые они ставят перед арбитрами.

Q-сортировка в этом отношении ближе к методике Тёрстоуна. В этом методе используется шкала жесткого распределения (forced distribution scale) из девяти пунктов: пункт 1 соответствует минимальной степени интенсивности измеряемого признака (например, наименьшей степени одобрения), а пункт 9 – максимальной степени интенсивности (например, наивысшей степени одобрения). В отличие от методики Тёрстоуна в рамках данной шкалы не предусмотрено отражение нейтрального или антитетического (прямо противоположного) суждения или оценки. Цель здесь состоит в том, чтобы просто ранжировать (упорядочить) все суждения вдоль единой оценочной оси. Кроме того, при пользовании Q-шкалой арбитры связаны ограничениями сильнее, чем в методике Тёрстоуна. Арбитру дается определенная жесткая квота на каждую категорию шкалы (т.е. ожидаемое число слов или фраз, которые должны быть им отнесены к данной категории), а затем ему предлагается распределить заданный набор терминов так, чтобы установленные квоты не нарушались. Квоты основаны на предположении (не обязательно верном), что колебания в интенсивности слов и фраз должны укладываться в рамки нормального распределения (когда изучаемые случаи максимально скучены в средней части шкалы, а по мере продвижения к ее полюсам их число равномерно убывает). Арбитры, таким образом, вынуждены давать относительные оценки конкретным словам и фразам [c.280] (случаям), относя их к определенным категориям шкалы ¹. Эта процедура отражена в табл. 9.2.

Таблица состоит из трех строк. В первой представлены значения (оценки), приданные каждой категории шкалы (от 1 до 9). Во второй отображено процентное распределение всех изучаемых случаев по девяти категориям. Эти числа суть квоты, из которых исходит каждый арбитр. Так, например, каждый арбитр должен 5% всех случаев отнести к категории 1, 8% всех случаев – к категории 2, 12% – к категории 3 и т.д. В третьей строке таблицы указано конкретное число случаев, определяемое данным процентным отношением для конкретной исследовательской проблемы. По исходному предположению табл. 9.2 каждому арбитру нужно ранжировать 50 слов или тем. Числа в строке 3, таким образом, представляют собой результаты вычисления процентных отношений, указанных в строке 2, от общего числа п = 50. Эти числа диктуют каждому арбитру, сколько случаев должно быть отнесено к каждой категории ². При проведении Q-сортировки строки 1 и 2 остаются все время неизменными, а в строке 3 значения меняются в зависимости от числа случаев, подлежащих ранжировке.

После того как арбитры завершили свою работу, вычисляется средняя (арифметическая) оценка шкалы для каждого случая, а затем полученные средние оценки соответствующим образом ранжируются. (Логическое обоснование этого последнего шага то же, что и в случае использования статистики интервальной шкалы анализа данных, полученных методом шкалирования по Тёрстоуну.) Далее результаты этого ранжирования случаев по [c.281] интенсивности используются для приписывания анализируемым текстам кодов, обусловленных встречаемостью в них слов или тем, получивших нашу оценку. Произвольность оценки одного исследователя заменяется таким путем коллективной мудростью нескольких арбитров.

Шкалирование методом парного сравнения имеет те же цели, но техника его несколько иная. Каждый случай, подлежащий оценке, последовательно сравнивается попарно со всеми другими случаями, при этом каждый арбитр должен решить, какое из слов (или фраз) в каждой паре “сильнее” (или интенсивнее) другого. Так, если нам надо сравнить пять утверждений (случаев), то каждый арбитр будет последовательно сравнивать сначала 1-е из них со 2-м, с 3-м, 4-м, 5-м, потом 2-е с 3-м, 4-м, 5-м и т.д., всякий раз при этом отмечая, какое из двух более интенсивно. Подсчитав, сколько раз каждый случай оказался в оценке всех арбитров “сильнее” других, и разделив полученное число на число арбитров (т.е. вычислив среднюю оценку, вынесенную группой арбитров каждому утверждению), мы получаем возможность осуществить количественное ранжирование всех случаев по степени их интенсивности. Чем выше средняя оценка некоторого утверждения, тем оно, по мнению арбитров, “сильнее”.

С методами Q-сортировки и парного сравнения связаны по меньшей мере две сложности. Во-первых, в обоих этих случаях исследователь полагается полностью на решения арбитров, критерии оценки которых могут быть, а могут и не быть правомерными и/или состоятельными. В экспертизе такого рода стандарты не всегда ясны или, во всяком случае, не всегда ясно определены, и вследствие этого сами оценки носят дискуссионный характер. Действительно, не столь редки случаи, когда один и тот же арбитр выставляет различные оценки одному и тому же утверждению в серии идентичных испытаний. Поскольку мы здесь подвергаем выборочному обследованию не людей, а содержание сообщений, у нас нет четко обозначенной референтной группы населения, как при шкалировании по Тёрстоуну, и нет также набора имплицитных параметров, на которые можно было бы равняться. Другими словами, отбор арбитров в высшей степени произволен. Следовательно, и надежность результатов, полученных при опоре на таких арбитров, может быть минимальной. В [c.282] довершение ко всему эти оценочные методы могут оказаться весьма утомительными и громоздкими. Q-сортировка 100–200 случаев, требующая бесконечно повторяющейся идентификации мельчайших различий между ними, или же попарное сравнение 50 случаев, требующее рассмотрения 1225 различных пар (n[n–1]/2, где n – число случаев), может исчерпать терпение любого, сколь угодно прилежного арбитра. Поэтому к данным процедурам следует прибегать с осторожностью.

Помимо слов, тем и других элементов, обозначающих содержательную сторону сообщений, существуют и иные единицы, позволяющие проводить структурный контент-аналнз. В этом случае нас интересует не столько что говорится, сколько как говорится, и хотя мы не должны сильно отступать от предмета сообщения, но измеряем мы при этом нечто иное.

Нас может интересовать, например, сколько времени или печатного пространства уделено интересующему нас предмету в том или ином источнике. Сколько слов или газетных столбцов было уделено каждому из кандидатов во время определенной избирательной кампании? Сколько статей или страниц бывает ежегодно посвящено в американских политологических журналах анализу государственно-политических проблем Африки? Изменялось ли это количество за последние 30 лет или осталось неизменным?

С другой стороны, нас могут интересовать и другие, возможно, более тонкие вопросы, относящиеся к форме сообщения. Сопровождается ли конкретное газетное сообщение фотографией или какой-либо иллюстрацией? Ведь, как выяснилось, те, которые сопровождаются, привлекают больше читательского внимания. Каковы размеры заголовка данного газетного сообщения? Напечатано ли оно на первой полосе или же похоронено в ворохе реклам? При ответе на подобные вопросы нас интересуют не тонкости содержания, а способ презентации сообщения. Мы следим за фактом наличия или отсутствия материала по теме, за степенью его выделенности, за его размерами скорее, нежели за нюансами его содержания. В результате мы [c.283] зачастую получаем анализ с куда более надежными измерениями, чем в случае исследования, ориентированного на содержание (постольку, поскольку формальным показателям в меньшей степени присуща неоднозначность), но зато, как следствие, и куда менее значимый.

На рис. 9.1 представлен образец типичного кодировального бланка, используемого для записи данных в ходе структурного контент-анализа. Рисунок взят из работы, в которой исследовалось освещение в прессе выборов в конгресс ³. За единицу анализа в ней был принят материал о кандидате (candidate insertion), определяемый как любое газетное сообщение, в котором поименно или имплицитно упоминались любые кандидаты в конгресс от того округа, где распространялась данная газета. Таким образом, каждая строка кодировочной таблицы суммарно отражает признаки одного такого материала о кандидате.

О приписывании каждому столбцу кодировального бланка определенного номера мы будем говорить ниже, в гл. 12, а пока укажем на тип регистрируемой информации. После того как каждому случаю придан индивидуальный регистрационный номер, он классифицируется по типу (информационное сообщение, передовица, очерк на данную тему, письмо в редакцию), указываются: дата его публикации; имя кандидата, к которому он относится; название газеты, где он опубликован; общие предпочтения, если таковые выражены в материале; степень его выделенности по расположению на площади газетного листа (напечатан на первой полосе, на вкладыше, в подвале); наличие [c.284] или отсутствие сопроводительных фотографий или рисунков; наличие упоминания о кандидате в заголовке материала; основное содержание материала (предвыборные новости, реферат речи, публикация в поддержку кандидата); общий объем материала и объем той его части, которая относится непосредственно к интересующему нас кандидату.

Надо заметить, что измерения такого рода весьма поверхностно затрагивают само содержание каждого сообщения в отличие от детального и внимательного обследования, необходимого при содержательном анализе. В результате структурный контент-анализ обычно более прост в разработке и проведении, а потому и более дешев и надежен, чем содержательный контент-анализ. И хотя его результаты, возможно, удовлетворят нас в меньшей степени – ибо они дают нам скорее набросок, чем законченную картину сообщения, – но при ответе на конкретный исследовательский вопрос они могут зачастую оказаться вполне адекватными.

Хотя контент-анализ представляет собой относительно недорогой метод, опирающийся на доступные базы данных, и хотя при его проведении мы не рискуем столкнуться со сложностями и весьма специфическими этическими проблемами (кроме тех случаев, когда анализу подвергается конфиденциальная или засекреченная информация), нам все же надо проявлять определенную внимательность, чтобы избежать кое-каких трудностей, заключенных в этом методе.

Прежде всего необходимо учитывать, что сообщения публикуются и соответствующим образом составляются не просто так, а с какой-то определенной целью – с целью то ли информирования, то ли описания, то ли призыва, предписания, самозащиты или даже с целью дезинформации. Поэтому при анализе сообщений мы должны стараться интерпретировать их содержание не иначе, как в контексте их очевидных целей. Например, часто в китайской прессе можно встретить утверждения типа: “Весь китайский народ верит, что новая сельскохозяйственная политика является главным (коренным) шагом вперед на [c.285] пути к прогрессу и социальной революции”. Рассматриваемые по сути, они представляют собой очевидную демонстративную ложь, поскольку не может каждый из миллионов и миллионов человек осознавать какую-то одну установку (в данном случае мы не берем во внимание ее достоинства). С этой точки зрения мы бы должны были склониться к рассмотрению этих утверждений как наиболее вульгарной формы пропаганды. Однако из опыта изучения китайской прессы видно, что утверждения такого типа публикуются совсем не с целью чисто внешней иностранной пропаганды, но более всего предназначены для внушения самим китайцам веры в то, что их правительство хочет, чтобы они были сильными. Другими словами, такие утверждения о единодушии носят не описательный, но директивный характер. Знание этого позволит интерпретировать их скорее как удачный индикатор политических интересов китайских лидеров, нежели как бессмысленную и пустую пропаганду, и мы можем использовать их с некоторой выгодой для себя. Таким образом, цель, с которой информация вводится в оборот, сама по себе может рассмотрена как важный для понимания сути контекст, который мы должны попытаться по возможности вытащить.

Сходным образом и характер распространения того или иного сообщения может неявно выражать многое в его значении. Предвыборная листовка, распространяемая по списку адресов избирателей, является примером сообщений с ограниченной или особой сферой распространения. Даже общедоступная газета может иметь ограниченный или особый круг читателей. У “Нью-Йорк таймс”, например, читательская аудитория состоит из более состоятельных и образованных людей, чем у “Нью-Йорк дейли ньюс”, притом что обе газеты легкодоступны для всех. Журнал “Уолл-стрит джорнэл” можно купить везде в США, но круг его читателей охватывает далеко не все социально-экономические группы населения. Следовательно, если мы должны дать адекватную оценку значимости некоторого сообщения, нам зачастую надо при этом знать, кому оно адресуется и как распространяется. Опираясь то ли на чье-то индивидуальное мнение (например, на мнение хорошо осведомленных лиц), то ли на наведение справок, когда мы пытаемся узнать у отправителей сообщения список его получателей, толи на самоочевидные свидетельства, когда к документу прилагается список [c.286] всех ознакомившихся с ним лиц, иногда с их личными подписями, то ли на опрос читательской аудитории (типа тех, которые обычно проводят газеты, чтобы документально обосновать свои претензии по доставке), мы должны постараться измерить или оценить круг распространения сообщения. Эта информация позволит нам судить о значимости и о важности анализируемого нами материала.

Мы должны постараться правильно оценить степень доступности интересующих нас сообщений. Обеспечена ли нам возможность свободного отбора материалов для анализа? Доступны ли нам все материалы в неискаженном виде или же нам навязан некий контроль извне? Имеем ли мы доступ, например, только к рассекреченным документам (к газетам, издаваемым в расчете на иностранных читателей; к стенограммам только официальных заседаний правительственных комиссий)? Здесь мы имеем дело с проблемой обобщаемости результатов: вопрос в том, насколько репрезентативна исследуемая совокупность сообщений, не говоря уже о выборке из нее. Если совокупность непредставительна, то исследователь при отсутствии у него должной бдительности может быть, самое малое, введен в заблуждение, а то и хуже: может стать объектом сознательной манипуляции.

В каждом из этих случаев основная сложность заключается в том, что информация, необходимая для адекватной оценки, может быть нам просто недоступна. Мы можем не знать и не иметь возможности уточнить цели сообщений, сферу их распространения и реальную степень своего доступа к ним. За этим скрываются весьма многообразные опасности, и контент-аналитик должен быть наготове, чтобы вовремя с ними справиться. Нельзя строить свои оценки на первом впечатлении; напротив, надо сохранять здоровый скептицизм в отношении имеющихся данных, до тех пор пока не будут получены ответы на все обсуждавшиеся выше вопросы. Сказанное, конечное, не означает, что в условиях неопределенности проведение контент-анализа исключается; оно значит только, что, приступив к анализу, исследователь не должен забывать об этой неопределенности.

Наконец, следует сказать несколько слов о надежности интеркодирования. За исключением полностью компьютеризованных контент-аналитических процедур (существует [c.287] целый ряд программ, специально разработанных в расчете на составление словарей ключевых слов, а также на поиск в тексте и числовую обработку последних), контент-анализ целиком опирается на суждения совершенно определенного человека о содержании сообщения. В конце концов, информация сама себя не анализирует. Она изучается, обрабатывается, обсчитывается и классифицируется человеком в лице конкретного исследователя. При этом разные исследователи могут расходиться между собой в понимании данного сообщения. Однако измерения могут считаться достаточно надежными лишь тогда, когда относительно их содержания между исследователями достигнут определенный уровень консенсуса. Надежность интеркодирования – термин, используемый в политологии для описания степени такого консенсуса. Чем она выше, тем лучше. Повысить надежность интеркодирования можно с помощью следующих правил:

1. К операционализации любой переменной следует подходить с осторожностью и тщательностью. Удостоверьтесь в том, что все значения сформулированы ясно и по возможности недвусмысленно. На деле такая мера поможет формированию общих критериев оценки, которые можно будет последовательно использовать при классификации и измерении содержания.

2. Используйте услуги как можно большего числа наблюдателей (кодировщиков). Чем больше людей участвует в достижении консенсуса, тем он более значим. Конечно, это может привести к сильному увеличению объема работы (а в случае если наблюдатели плохо подготовлены, то и к риску увеличения ошибки измерения), но и отдача от этой меры может быть очень велика. Ограничивающим фактором здесь обычно выступает нехватка денежных средств.

3. Всячески способствуйте тому, чтобы наблюдатели как можно больше взаимодействовали между собой. Проводите совместные практические занятия с обязательным обсуждением всех нюансов в интерпретации данных; это приведет к достижению консенсуса не только в отношении самих данных, но и в отношении истинных значений операциональных определений.

Успех вышеприведенных мер может быть численно оценен двумя разными способами, связанными со [c.288] статистическими понятиями, которые мы подробнее обсудим в гл. 16. Один из этих способов, применяющийся главным образом в содержательном контент-анализе, состоит в том, что все наблюдатели, задействованные в данном проекте, независимо друг от друга анализируют и кодируют одно и то же сообщение (т.е. приписывают ему свои собственные числовые оценки), после чего вычисляется коэффициент корреляции (r Пирсона) кодов, выданных каждыми двумя наблюдателями. Этот коэффициент измеряет степень согласованности между собой принадлежащих разным наблюдателям оценок наличия и/или частоты встречаемости отдельных слов или тем. Значения коэффициента колеблются в диапазоне от –1 до +1, и показания от +0,9 и выше обычно свидетельствуют о высокой степени интерсубъективной надежности кодирования ⁴.

Другой прием более подходит для структурного контент-анализа, при котором нас интересует не столько трактовка тем, сколько факт их наличия или отсутствия, и при котором дублирующие друг друга измерения не столь необходимы. В данном случае мы рассматриваем все расхождения между наблюдениями, принадлежащими разным наблюдателям, как самостоятельную переменную, в отношении которой имеет смысл задать вопрос, связана ли она с систематическими расхождениями значений любой другой измеренной нами переменной. Другими словами, нас занимает проблема: возможно ли, что один (или более) наблюдатель фиксировал результаты последовательно отличным от других наблюдателей образом? Если признать, что все случаи были распределены между наблюдателями без смещений (обычно особые усилия приходится приложить, чтобы распределить их случайным образам), то любые систематические расхождения, наблюдаемые нами, являются результатом скорее расхождений между кодировщиками, нежели глубинных расхождений между отдельными случаями, которые оказались приписанными ошибающемуся наблюдателю. Коэффициент надежности интеркодирования здесь принимает форму (1–η²), где η – мера рассеяния значений каждой зависимой переменной, обусловленная наличием расхождений между кодировщиками ⁵. Вычтя эту “межнаблюдательскую ошибку” из 1, мы получаем долю наблюдений, свободных от ошибки. Данный коэффициент вычисляется [c.289] отдельно для каждой переменной, и, чтобы можно было рассчитывать на достаточную надежность измерений, должен превышать 0,9.

Мы видим, что контент-анализ – это методика с широким спектром применения, с определенными преимуществами в виде дешевизны, небольшого объема выборки, доступности данных. Однако, возможно, более, чем любой другой метод, он требует тщательной операционализации всех переменных и постоянного мониторинга процесса Наблюдения. Благодаря ему можно получить высокоинформативные результаты, которые, однако, должны интерпретироваться лишь в контексте, подчас не достижимом средствами только контент-анализа. По этой причине этот метод используется чаще всего в сочетании с другими методами сбора данных (опросом, непосредственным наблюдением).

Общие работы по контент-анализу и соответствующим методикам: North R.С. et al. Content Analysis: A Handbook with Applications for the Study of International Crisis. – Evanston: Northwestern Univ. Press, 1963. Особое внимание в этой работе уделено методам измерения надежности и шкалирования по признаку интенсивности. Stone Ph. J. (ed.). The General Inquirer. – Cambridge (Mass.): МГГ Press, 1966. Книга Стоуна дает примеры применения широко распространенной компьютерной методики контент-анализа, опирающегося на элементы структуры предложения. [c.290]

Детальный обзор контент-аналитических приемов см. в: Krippendorff К. Content Analysis: An Introduction to its Methodology. – Beverly Hills: Sage, 1980.

Основы контент-анализа см. в: Weber R. Ph. Basic Content Analysis. – Beverly Hills: Sage, 1985.

О применении контент-анализа в политологии: Мerritt R.L. Symbols of American Community, 1735–1775. – New Haven (Conn.): Yale Univ. Press, 1966. В книге Мерритта исследуется развитие американского национального самосознания (по материалам американской печати колониального периода). Fоwles J. Mass Advertising as Social Forecast: A Method for Future Research. – Westport: Greenwood Press, 1976, – анализ содержания реклам как основа для прогнозирования социального развития.

Контент-аналитическое измерение тем насилия в американском телерепертуаре см. в: Gеrbnеr G., Сrоss L. Living with Television: The Violence Profile. // Journal of Communication. 1976. Vol. 26. P. 173-199.

Graber D.A. Processing the News: How People Tame the Information Tide. – White Plains: Longman, 1988. Грабер пишет о применении контент-анализа к кодированию дневников и экспертных интервью; экземплифицирует преимущества комплексных проектов, использующих сразу несколько разных исследовательских методов.

Примеры применения контент-анализа и обсуждение связанных с ним методологических вопросов регулярно можно встретить на страницах журналов “Journalism Quarterly”, “Journal of Communication”, “Communication Research”. [c.291]

1 Более подробно метод Q–сортировки см. в: МсКeоwn В., Thomas D.Q. Methodology. – Newbury Park, Calif.: Sage, 1988.
Вернуться к тексту

2 Поскольку это могло бы привести к дробным записям или к асимметрии в распределении, случаи были несколько перераспределены в направлении центра таблицы так, чтобы сохранилось свойство нормальности.
Вернуться к тексту

3 См.: Маnheim J.B. Urbanization and Differential Press Coverage of the Congressional Campaign. // Journalism Quarterly. 1974. Vol. 51. P. 649–669.
Вернуться к тексту

4 Более сложные варианты данной методики (с приложением ее к измерению интенсивности) описаны в кн.: North R.С. et al. Content Analysis: A Handbook with Applications for the Study of International Crisis. – Evanston: Northwestern Univ. Press, 1963, ch. 4–5.
Вернуться к тексту

5 Формула и процедура вычисления этой статистики, являющейся мерой ассоциации между одной номинальной и одной интервальной переменными, описаны в кн.: Freeman L.С. Elementary Applied Statistics for Students of Behavioral Science. – N.Y.: Wiley, 1965. Р. 120–129.
Вернуться к тексту

Библиотека Михаила Грачева

предыдущая

следующая

оглавление

Мангейм Дж. Б., Рич Р.К.

Политология: Методы исследования

предыдущая

следующая

оглавление

Категория (значение)	1	2	3	4	5	6	7	8	9
Распределение (в процентном отношении)	5	8	12	16	18	16	12	8	5
Распределение (по числу случаев)	2	4	6	8	10	8	6	4	2