Методы тематической классификации текста: на примере образа Российской Федерации в New York Times тема диссертации и автореферата по ВАК РФ 22.00.01, кандидат наук Просянюк, Дарья Вячеславовна

  • Просянюк, Дарья Вячеславовна
  • кандидат науккандидат наук
  • 2014, Москва
  • Специальность ВАК РФ22.00.01
  • Количество страниц 181
Просянюк, Дарья Вячеславовна. Методы тематической классификации текста: на примере образа Российской Федерации в New York Times: дис. кандидат наук: 22.00.01 - Теория, методология и история социологии. Москва. 2014. 181 с.

Оглавление диссертации кандидат наук Просянюк, Дарья Вячеславовна

Содержание

Введение

Глава 1. Подходы к проведению тематического анализа текстов

§ 1. Способы отбора источников

§2. Формализованный подход: кластерный анализ, тематическое

моделирование

§3. Эвристический подход: тематический анализ

§4. Стратегия смешивания методов (mixed methods research)

Резюме

Глава 2. Теоретико-методологические основания изучения образа

Российской Федерации в средствах массовой информации

§1. Образ России как междисциплинарное понятие

§2. Ключевые ценности американского общества

§3. Новости как дискурс

Резюме

Глава 3. Описание и апробация алгоритма тематической

классификации текста в рамках стратегии смешивания методов

§1. Описание алгоритма проведения исследования

§2. Образ России как интегральное понятие

§3. Ценности американского общества в статьях «Нью-Йорк тайме»

о России

Резюме

Заключение

Список использованной литературы

Приложение 1

Приложение 2

Рекомендованный список диссертаций по специальности «Теория, методология и история социологии», 22.00.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методы тематической классификации текста: на примере образа Российской Федерации в New York Times»

Введение

Актуальность темы исследования

Стремительное распространение технологий производства, обработки, трансляции и хранения информации в текстовом виде, лавинообразный рост и широкая доступность данных в электронном виде, а также повышение роли информации как ресурса и основы принятия решений обусловили запрос на разработку автоматизированных средств обработки и анализа текстовых данных. В настоящее время мы являемся свидетелями интервенции формализованных методов анализа текстовых данных1, что обусловливает завышенные ожидания к возможностям автоматизированных средств и их неадекватное использование. Основными причинами завышенных ожиданий, на наш взгляд, является агрессивная маркетинговая политика корпораций-разработчиков специализированного программного обеспечения, акцентирующая внимание на возможности практически полного исключения человека при сборе, обработке и анализе информации; низкий уровень осведомленности пользователей об алгоритмах и ограничениях методологий, лежащих в основе того или иного программного продукта; а также исключительно небольшое количество междисциплинарных научных исследований, направленных на решение задач определения «границ» и условий применения формализованных методов анализа текстовых данных в гуманитарных науках (которые являются одним из их основных «потребителей»).

Вместе с тем, подавляющее большинство современных гуманитарных исследований, содержащих этап обработки текстовой информации (в том числе ответы на открытые вопросы анкеты, транскрипты интервью и фокус-групп, тексты новостей и пр.), продолжают использовать традиционные

' Формализованные методы анализа текстовых данных развивались обособленно, чаще в технических дисциплинах, таких как искусственный интеллект, нейросетевое моделирование, лингвистическое обеспечение систем автоматизированного проектирования и программирования и пр.

методы анализа, основанные на эвристических алгоритмах": кодировании, априорной категоризации и пр. Основными причинами устойчивого применения традиционных методов анализа текстовых данных, па наш взгляд, является определенная степень инерционности методической составляющей исследований; неизученность, и, как следствие, отсутствие доказательств надежности и валидности формализованных методов при решении конкретных задач социального анализа; а также отсутствие исследований, посвященных верификации возможностей и условий интеграции различных направлений методов анализа текстовых данных.

Таким образом, в настоящее время наблюдается значительный разрыв между потенциальными возможностями формализованных методов анализа текстовых данных и фактическим использованием их потенциала. Применение формализованных методов для анализа больших массивов текстовых данных для решения задач социального анализа является скорее новаторством, чем нормой. Возможно, по причине того, что применение методов не стало нормой, они используются не всегда корректно и адекватно поставленным задачам.

Несмотря на взрывной рост количества методов и алгоритмов формализованного тематического анализа, крайне малочисленны исследования, дающие представления и конкретные руководства эмпирическому исследователю-гуманитарию об их специфике, достоинствах и недостатках. Узконаправлены и немногочисленны исследования, сфокусированные на сравнительной оценке применимости отдельных направлений методов анализа текстовых данных в конкретных исследовательских ситуациях, определяющие роль эвристических алгоритмов в процессе анализа. Следствием является отсутствие пошагового алгоритма анализа корпуса текстовых данных, основанного и

2 Пол эвристическими алгоритмами понимается способ анализа данных и решения задам, не имеющий строю) о обоснования, но дающий приемлемые решения и большинстве практически значимых залам.

направленного на решение конкретной задачи социального анализа, необходимого в эмпирических исследованиях. Сказанное позволяет считать, что работа, направленная на изучение специфики и ограничений методов формализованного анализа текстовых данных и разработку стратегий их интеграции с эвристическими методами является актуальной. Подобная схема поможет систематизировать и адаптировать основные наработки точных наук в области анализа текстовых данных, продемонстрирует области единоличного «господства» каждого из направлений анализа, поспособствует очерчиванию круга типовых задач, потенциально интересных для решения формализованными методами. Также подобное руководство может быть тиражировано и адаптировано для решения широкого круга научных и практических задач.

Разработанность проблем ы

Мы исходим из предположения, что определение типов и конкретных параметров методов тематической классификации текста зависит от задач исследования. Поэтому круг проанализированных в диссертации работ содержит публикации, посвященные как современным методам и алгоритмам тематической классификации текста, так и работы, связанные с содержательным фокусом исследования. В качестве такового был выбран образ Российской Федерации в одном из наиболее влиятельных американских и мировых изданий - «Нью-Йорк тайме». Интерес и актуальность изучения данного объекта обусловливаются важностью в информационном обществе образа страны для адекватного диалога между странами на различных уровнях.

В спектре современных методов анализа текста в гуманитарных науках можно выделить два основных подхода к тематической классификации текста - формализованный и эвристический (неформализованный, слабо формализованный).

Начало развития формализованных методов анализа текста в гуманитарных дисциплинах принято связывать с возникновением метода контент-анализа. Работы, нацеленные на количественное измерение параметров содержания текстов, тематическую классификацию газет появляются на рубеже XIX—XX веков. В этом русле работали Г. Спид3, М. Уилли4, С. Кингсбери, X. Харт и Л. Кларк, Дж. Вудворд. Методику анализа средств массовой информации, предложенную в своей работе М. Уилли, использовал советский исследователь общественного мнения и прессы В.А. Кузьмичев3.

Стремительное распространение средств массовой информации, а также повышение актуальности изучения пропагандистских материалов обусловили необходимость разработки метода, позволяющего выявлять социальные цели текстов на основании количественного анализа эксплицированного содержания. Теоретической основой послужила классическая модель массовой коммуникации Г. Д. Лассвелла {кто, что, по какому каналу, кому говорит и с каким эффектом). На конференции по исследованию междисциплинарных средств массовой коммуникации в Чикаго в августе 1941 г. был предложен термин для нового метода -контент-анализ. Суть анализа в данный период заключалась в анализе знаков и утверждений с целью проверки их влияния на аудиторию; результатом анализа была частота определенных символов, их интенсивность и оценка отправителя. Среди видных исследователей следует назвать Б. Берельсона и П. Сальтера6, Н. Лейтеса, И. Пула, И. Яниса, Р. Фаднера, А. Каплана, Дж. Голдсена, А. Геллера.

Разработке и апробированию методики статистического измерения интенсивности отношения коммуникатора к определенным объектам в

' Speed G. Do Newspapers Now Give the News? //'I he Foruin. 1893. Vol. XV. P. 705-711

4 Willey M. The Country Newspapers. Chapel Hill. N.C.: University of North Carolina Press. 1926

5 Кузьмичев B.A. Печатная агитация и пропаганда. М„ Л., 1930.

6 Berelson В. and Salter P. Majority and Minority Americans // Public Opinion Quarterly. 1946. Vol.10. No.2. P. 168- 190

тексте на основании лингвистически зафиксированных единиц посвящены работы Ч. Осгуда, Дж. Нанелли и С. Сапортой7, Г. ван ден Верг и К. ван дер Виер.

В советской школе освоение контент-анализа как социологической методики проходило посредством анализа писем системы Гостелерадио, анализа текстов массовых газет, мониторинга телевизионных информационных программ. Данное направление представлено работами

о

В. Шляпентоха, Б.А. Грушина, A.B. Жаворонкова, JI. Н. Федотовой , И.А. Красавченко, A.B. Баранова и многих других.

Развитие технологий производства и трансляции информации, широкая доступность данных в электронном виде определили потребность в разработке формализованных методов анализа больших массивов текстовых данных. Взрывной рост количества методов и алгоритмов формализованного анализа текстов приходится на рубеж XX—XXI веков. На сегодняшний день наиболее широкое распространение получил подход «мешок слов» (bag of words). Основной гипотезой данного подхода является предположение о том, что порядок следования слов в тексте не имеет значения для анализа, текст рассматривается как неупорядоченная совокупность слов (вектор, состоящий из частот слов). В упрощенном варианте каждое слово имеет равный «вес», порядок документов в корпусе (также как и порядок слов в тексте) не имеет значения, слова, встречающиеся часто в большом количестве текстов (так называемые стоп-слова) исключаются из анализа, разные формы слов считаются одним словом. Одно из первых упоминаний данного похода мы находим у 3. Харриса9.

7 Osgood Ch., S. Saporta, J. Nunnally. Evaluative Assertion Analysis // Litera. 1956. Vol.3. P. 47-102

8 Федотова Л.Н. Телемосты СССР-США: комплексное социологическое исследование. М., 1990. С. 16-17, 32-33.

9 Harris Z. S. Distributional structure // Word. 1954. No. 10. P. 146-162.

В современной компьютерной лингвистике формализованные подходу к анализу текста, основанные на подходе «мешок слов», разрабатываются Д. Журавски и Дж. Мартином10, К. Маннингом, П. Рагхаваном и X. Шютце11 и другими.

Разработке метода тематического моделирования, нацеленного па выявление латентных тем в корпусе текстов, посвящены работы Д. Блэя12, Д. Мимно13, А. Дауда14, М. Джордана, А. Энджи, Дж. Ли, Л. Жоу, Ф. Мухамеда, Е. Завитсаноса, Г. Палиураса, Г. Вуроса, Дж. Цанга, У. Сонга, С. Занга, Ш. Лью, К. В. Воронцова и А. А. Потапенко13, С.В. Царькова и многих других.

Метод анализа тональности, призванный выявить эмоциональную «окраску» текста, разрабатывается в работах Б. Лью16, Б. Панга, Л. Ли и С. Вайтинатан и других.

Очевидное преимущество данного подхода к анализу текста состоит в возможности обработки больших корпусов текстов. В целом, в современных условиях основным ограничением являются технические возможности компьютеров. Вторым преимуществом является объективность кодирования - на этапе обработки данных полностью исключено человеческое влияние, а, следовательно, риск субъективности и неустойчивости результатов. В качестве недостатков данного подхода следует отметить учет исключительно прямого значения слов, неразличение жанров, скрытых смыслов, коннотаций и пр. Также необходимо указать на технические сложности. Особенно явно проблемы проявляются при работе

10 Jurafsky D., Martin J. Speech and natural language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Prentice Hall: Upper Saddle River, NJ, 2000.

" Маннинг К., Рагхаван П., Шютце X. Введение в информационный поиск.: Пер. с англ. М: ООО «И.Д. Вильяме, 2011.

12 Blei. D. Probabilistic topic models // Communications of the ACM. 2012. Vol. 55. No. 4. P. 77-84

M Minino D., Blei D. Bayesian Checking for Topic Models // Empirical Methods in Natural Language Processing, 2011. P. 227-237.

" Daud A. Using Time Topic Modeling for Semantics-Based Dynamic Research Interest Finding // Knowledge-Based. 2012. Vol. 26, P. 154-163.

и Воронцов К. В.. Потапенко А. А. Регуляризация, робастность и разреженность вероятностных

1емашческих моделей// Компьютерные исследования и моделирование. 2012. Т. 4. № 12. Р. 693-706. Bing L. Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers. 2012.

с русским языков, сложность которого обусловливает проблемы на этапе

17

нормализации (особенно лемматизации), учет синонимии, анафорических связей18 и пр.). Одним из недостатков данного подхода является определение темы как совокупности слов в тексте, в то время как зачастую семантика, наиболее точно описывающая проблему текста, не эксплицирована. Данный недостаток призван компенсировать альтернативный метод - эвристический тематический анализ.

Неформализованный, эвристический тематический анализ рассматривает текст как совокупность смыслов. Всякий текст трактуется как авторское описание и представление проблемы, реализуемое с помощью целенаправленного конструирования социальных смыслов. Исследователя интересует, скорее, выявление и толкование смыслов, явно и неявно транслируемых автором, интерпретация проблем, реконструкция позиций и типов аргументации, интерпретация авторского видения социальной реальности. Эвристический тематический анализ восходит к теории

19

аргументации , основан на индуктивном подходе, который, в первую очередь, имеет описательный характер и поисковые задачи20.

Эвристический тематический анализ требует активного участия и интерпретации со стороны исследователя. Он выходит за рамки подсчета слов или фраз и сосредоточивается на выявлении и описании явных и неявных идей в текстах, то есть тематической структуры текста. При

17 Нормализация - приведение всех словоформ одного слова к единой основе. Целыо нормализации является уменьшение количества уникальных слов, то есть снижение размерности текста. С) mecí in ет два вида первою этапа нормализации текста: лемматизация (lemniatization) и сгэмминг (stemming). Первый предполагай! приведение каждого слова в словарную форму (лемму) (существительное - именительный падеж, единственное число, глагол - неопределенная форма и пр.), второй - приведение слова к его основе (морфеме) путем «обрезания» (окончании, суффиксов и пр.), чтобы оставшаяся часть была одинаковой для всех грамматических форм. Лемматизация является более эффективной, так как использует словари и опирается на контекст, стэмминг намного более фубый алгоритм, но более быстрый. В нашей работе при проведении эмпирического анализа применялась лемматизация.

18 Анафорические связи в тексте - отношения между частями текста (между словами, словосочетаниями, выскчиываниями), при которых в смысл одного слова (словосочетания, высказывания) входит отсылка к другому слову (словосочетанию, высказыванию).

14 Attride-Stirling J. Thematic networks: an analytic tool for qualitative research // Qualitative Research. 2001. No. 1,15. 385-405.

20 Guest G., MacQueen K., Namey E. Applied thematic analysis. Thousand Oaks, California: Sage. 2012.

проведении анализа разрабатываются коды - маркеры тем, используемые в дальнейшем анализе. В целом можно отметить наличие двух точек зрения на сущность тематического анализа. Ряд исследователей (Г. Гест, К. МакКуин, Е. Нэйми, В. Браун и В. Кларк" ) полагают, что тематический анализ является интегральным методом: он включает в себя процедуры, заимствованные у обоснованной теории, дискурс-анализа и других методов. Метод перенимает преимущества у других методов из теоретического и методологического арсенала и адаптирует к прикладным исследованиям (автор настоящей работы придерживается данной точки зрения). С другой стороны, существует точка зрения22, что тематический анализ не является самодостаточным методом анализа данных, а, скорее, инструментом, который используется другими методами. В любом случае, данных подход достаточно распространен в гуманитарных науках (см., например, работы Д. Сингер и М. Хантер23, X. Рубин и И. Рубин24, Г. Тейлор и Дж. Ашер2э).

Исследования, посвященные проблеме формирования и восприятия образа Российской Федерации, были объединены в несколько направлений. Они сфокусированы на политической26, географической27, политико-психологической28, маркетинговой29, историко-культурной30 или социологической31 детерминанте в подходе к изучению образа

21 Braun V., Clarke V. Using thematic analysis in psychology // Qualitative Research in Psychology. 2006. Vol. 3. No. 2.

22 Boyatzis R.E. Transforming qualitative information: thematic analysis and code development. Thousand Oaks, CA: Sage. 1998.

21 Singer D., Hunter M. The experience of premature menopause: a thematic discourse analysis // Journal of Reproductive and Infant Psychology. 1999. Vol. 17. No. 63. P. 63-81.

2' Rubin 11.J., Rubin, I.S. Qualitative interviewing: the art of hearing data. Thousand Oaks, CA: Sage. 1995.

25 Taylor G.W., Ussher J.M. Making sense of S&M: a discourse analytic account // Sexualities. 2001. Vol. 4. No. 293. P. 293-314.

26 Галумов Э.А. Имидж.против имиджа. M.: Известия, 2005.

27 Замятии Д.Н. Метагеография: Пространство образов и образы пространства. М.: Аграф, 2004.

28 Образы государств, наций и лидеров / Под ред. Е.Б. Шестопал. М.: Аспект Пресс, 2008.

29 Панкрухин А.П. Маркетинг территорий. 2-е изд., дополн. Спб.: Питер, 2006.

Федоров А.В. Трансформация образа России на западном экране: от эпохи идеологической конфронтации (1946-1991) до современного этапа (1992-2010). М.: Изд-во МОО «Информация для всех», 2010.

11 «Рычащий медведь» на «диком Востоке» (Образы современной России в работах американских авторов: 1992-2007) / Сост. Э. Я. Баталов, В. IO. Журавлева, К. В. Хозпнская. М.: Российская политическая энциклопедия (РОССПЭН), 2009.

Российской Федерации. Ни в одной из дисциплин исследователи не уделяют внимания обоснованию применения формализованных методов для эмпирического анализа образа Российской Федерации.

Проблема исследования заключается в несоответствии между потенциальными возможностями формализованных методов анализа текстовых данных и обоснованностью их использования. Отсутствует оценка целесообразности и эффективности интеграции формализованных методов с эвристическими методами анализа текстовых данных.

Теоретический объект исследования — смешанная (mixed), или интегративная, методология тематического анализа больших текстовых массивов.

Предмет исследования — конфигурация формализованных и эвристических методов на разных этапах реализации интегральной стратегии тематической классификации текста.

Конфигурация методов рассматривалась на примере текстового массива, репрезентирующего образ Российской Федерации. Эмпирическим объектом исследования явился корпус статей о Российской Федерации, опубликованных в «Нью-Йорк тайме» в период с августа 2011 г. по июль 2012 г.

Цель исследования - оценить относительную эффективность формализованных и эвристических методов на разных этапах реализации интегральной стратегии тематической классификации текста. В соответствии с поставленной целью, в работе последовательно решаются следующие задачи:

1) Дать систематическое описание основных методов тематической классификации текста;

2) Систематизировать применение основных подходов и методов тематической классификации текста применительно к кейсу исследований образа России;

3) Разработать и апробировать алгоритм тематической классификации текста в рамках стратегии смешивания формализованных и эвристических методов анализа текстов на примере репрезентаций образа России в «Нью-Йорк тайме» в период 2011-12 гг.;

4) Сравнить оценки свойств тематической структуры массива текстов, полученные альтернативными методами: формализованный тематический анализ (кластерный анализ, тематическое моделирование) vs. эвристический тематический анализ;

5) Сравнить оценки тональности массива текстов, полученные альтернативными методами: метод оценки тональности, основанный на обучении с учителем vs. эвристическое кодирование.

Методологические и теоретические основания исследования Методология исследований с использованием смешанных методов описана в работах Дж. Брюэра и А. Хантера32, Дж. Красвела33, Дж. Грина, В. Карачелли, В. Грэхама34, Р. Джонсона и JT. Кристенсена33, И. Ныомана и К. Бентц36, А. Ташакорри и К. Тэдди37. Исследования Е. Кример и

"2 о

М. Гостом демонстрируют возможности смешивания формализованных и эвристических методов при применении контент-анализа.

В более узком смысле теоретико-методологическую базу исследования составляют работы, посвященные основным подходам и алгоритмам методов тематической классификации текста, описывающие основные принципы и этапы применения методов тематической классификации текста. Формализованное направление представлено

32 Brewer J., Hunter A. Multimethod research: A synthesis of styles. Newbury Park, CA: Sage, 1989.

Creswell J. Research design: Qualitative, quantitative, and mixed approaches. Thousand Oaks, CA: Sage, 2003.

31 Greene J., Caracelli V., Graham W. Toward a conceptual framework for mixed-method evaluation designs // Educational Evaluation and Policy Analysis. 1989. Vol. 11. P. 255-274.

35 Johnson R., Christensen L. Educational research: Quantitative, qualitative, and mixed approaches. Boston, MA: Allyn and Bacon, 2004.

36 Newman I., Benz C. Qualitative-quantitative research methodology: Exploring the interactive continuum. Carbondale, IL: Southern Illinois University Press, 1998.

37 Tashakkori A., Teddlie C. (Eds.). Handbook of mixed methods in social and behavioral research. Thousand Oaks, CA: Sage, 2003.

38 Creamer E., Ghoston M. Using a Mixed Methods Content Analysis to Analyze Mission Statements From

Colleges of Engineering//Journal of Mixed Methods Research, 2013. P..15-28.

работами К. Криппендорфа39, Р. Поппинга40, К. Робертса", Дж. Триммера42, Б. Лыо, Д. Журавски и Дж. Мартина, Д. Блэя, А. Дауда. Представление методов эвристического блока основано на работах Г. Геста, К. МакКуин, Е. Нэйми, В. Браун и В. Кларк.

Различение структурных элементов новостного сообщения как обособленных единиц анализа основано на подходе Т. Ван Дейка к новостям как особому типу дискурса43.

Применительно к кейсу исследований образа России были проанализированы работы Э.А. Галумова, Д.Н. Замятина, Е.Б. Шестопал, Т.Н. Пищевой, Н.С. Виноградовой, А.Д. Недовой44, С. Анхольта43, А.П. Панкрухина, А.В. Федорова, В.И. Журавлевой46. Эмпирическая база исследования

Эмпирическую базу исследования составляет корпус статей «Нью-Йорк тайме» о России за период август 2011 - июль 2012 г. В данный промежуток времени уровень информационного внимания к событиям в России был достаточно высок, поскольку проходили думские и президентские выборы, а также был назначен новый состав кабинета министров. «Нью-Йорк тайме» был выбран потому, что данное издание традиционно является одной из предпочитаемых элитой газет, одной из наиболее цитируемых политиками, повестка «Нью-Йорк тайме» имеет значительное влияние на общественное мнение. Также данная газета содержит больший объем иностранных новостей, чем другие крупные американские газеты. Кроме того, что нетипично для американской прессы,

У) Krippendorff К. Content Analysis: An Introduction to Its Methodology. 2nd edition, Thousand Oaks, CA: Sage 2004.

10 Popping R. Computer-assisted text analysis. London: SAGE Publications, 2000.

41 Text Analysis for the Social Sciences: Methods for Drawing Statistical Inferences From Texts and Transcripts (Routledge Communication Series) ed. by Carl W. Roberts. Routledge, 1997.

42 Grimmer J. Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts // Political Analysis. 2013. Vol. 21. No. 3. P. 267—297.

' ' Ban Дейк Т. А. Язык, познание, коммуникация. Б.: БГК им. И. А. Болуэна де Куртенэ, 2000.

44 Пищева Т.Н., Виноградова Н.С., 11едова А.Д. Образ России под углом зрения политических коммуникаций//ПОЛИС. 2010. №4, С. 107-121.

45 Anholt S. Forward // Journal of Brand Management. 2002. Vol. 29. No. 4. P. 229-239.

46 Журавлева В.И. Понимание России в США: образы и мифы. 1881-1914. М.: РГГУ, 2012.

«Ныо-Йорк тайме» уделяет значительный объем печатных площадей иностранным корреспондентам и поэтому считается одной из наиболее независимых газет в США в сборе информации.

Отбор статей для анализа проходил в несколько этапов и был основан

17 48

на различении релевантной и пертинентной информации . Финальный корпус статей для анализа составил 411 статей «Нью-Йорк тайме», посвященных России.

Научная новизна исследования заключается в следующем:

1. Описаны и систематизированы методы тематической классификации текста в рамках двух основных направлений: формализованного и эвристического. В рамках формализованного, подхода выделены два направления анализа: с известными априори категориями (кластеризация, метод анализа тональности, контент-анализ) и неизвестными категориями (тематическое моделирование). Проведенная систематизация демонстрирует методные альтернативы для решения типовых задач социального анализа, а также предлагает возможные стратегии алгоритмизации в рамках каждого из подходов.

2. Разработан, обоснован и апробирован алгоритм тематической классификации текста в рамках стратегии смешивания методов. Алгоритм включает поэтапное применение формализованных и эвристических методов тематической классификации текста: многоступенчатый отбор данных (основанный на различении релевантной и пертинентной информации), определение единиц анализа, контент-анализ, определение тональности заголовков, классификация заголовков, описание кластеров заголовков; контент-анализ, классификация, выделение основных тем текстов статей; описание и анализ каждой темы, индуктивное выведение интегрального образа.

п Релевантность информации - степень соответствия результатов поиска задаче, поставленной в запросе. 18 Першнентность информации - степень соответствия результатов поиска информационной потребности пользователя/исследователя.

3. Обосновано выделение контекстуальных факторов, учет которых необходим для изучения любого тематически выделенного корпуса текстов, и дано их модельное описание. В частности, обобщены подходы к изучению образа России в СМИ. По эпистемологическим и методологическим основаниям выделено шесть направлений в исследовании факторов формирования образа страны: политическое, географическое, психологическое, маркетинговое, историко-культурное и социологическое.

4. На примере сравнения и оценки качества результатов тематического анализа, проведенного альтернативными методами, показано, что применение эвристических процедур кодирования значительно улучшает качество полученных результатов. В качестве альтернативных способов решения задачи тематического анализа рассматривались следующие методы: кластерный анализ, тематическое моделирование, эвристический.

5. В качестве дополнительного результата эмпирического исследования показано, что при описании событий в России авторы «Нью-Йорк тайме» апеллируют к традиционным ценностям американского общества. По результатам проведения контент-анализа продемонстрировано, что в большинстве статей упоминается ценность «демократия и свободное предпринимательство».

Похожие диссертационные работы по специальности «Теория, методология и история социологии», 22.00.01 шифр ВАК

Список литературы диссертационного исследования кандидат наук Просянюк, Дарья Вячеславовна, 2014 год

Список использованной литературы

1. Адилова Л. Ф. Механизм трансформации имиджа России // ПОЛИТЭКС. 2007. №3.

2. Ван Дейк Т. А. Язык, познание, коммуникация. М: 1989.

3. Галумов Э. Основы РЫ. М.: Летопись XXI, 2004.

4. Галумов Э.А. Имидж против имиджа. М.: Известия, 2005.

5. Егорова-Гантман Е,В. Психологические методики исследования личности политических лидеров. М., 1988.

6. Журавлева В.И. Понимание России в США: образы и мифы. 1881-1914. М.: РГГУ, 2012.

7. Замятин Д.Н. Метагеография: Пространство образов и образы пространства. М.: Аграф, 2004.

8. Замятина Н. Ю. Зона освоения (фронтир) и её образ в американской и русской культурах // Общественные науки и современность. 1998. № 5. С. 75-89.

9. Кара-Мурза С.Г. Манипуляция сознанием. М.: Алгоритм, 2000.

10.Караганов С.А. Российско-американские отношения на рубеже веков//М.: СВОП, 2000.

11 .Ким М.Н. Технология создания журналистского произведения СПб: Изд-во Михайлова В.А., 2001

12.Киселев И. Ю., Смирнова А. Г. Актуальные проблемы политической психологии. Москва, Ярославль: ИП РАН, 2001.

1 З.Киселев И.Ю. Принятие решений в политике: теоретические аспекты психологии выбора. Ярославль: ЯрГУ, 2000.

Н.Ковалева H.B. Образ современной России на страницах журнала "Der Spiegel" // Россия и русские глазами дальнего зарубежья. Сб. статей. Томск. 2002.

15.Колосов В.А., Зотова М.В. Геополитическое видение мира российскими гражданами: опыт применения методов «критической геополитики». «Критическое» направление в геополитике: стала ли, наконец, геополитика наукой? // Географическое пространство России: образ и модернизация. Сб. ст. / Под ред. Н.В. Каледина и

A.И. Чистобаева. СПб.: Изд-во «ВВМ», 2011. С. 92-114.

16.Крашенинникова В. Россия — Америка: холодная война культур. Как американские ценности преломляют видение России. М.: Европа. 2007.

17.Кронгауз М. Самоучитель олбанского. ACT, Corpus, 2013.

18.Лябухов И.В. О соотношении понятий «имидж государства» и «имидж страны» (к постановке проблемы) // Изв. Алтайского гос. ун-та. 2011. № 4.

19.Михайлов С. А. Журналистика Соединённых Штатов Америки. СПб.: Изд-во Михайлова В.А., 2004

20.Моделирование образов историко-культурной территории: методологические и теоретические подходы / Отв. ред. Д.Н. Замятин. М.: Институт наследия, 2008.

21.Образы государств, наций и лидеров / Под ред. Е.Б. Шестопал. М.: Аспект Пресс, 2008.

22.Ожегов С. И., Шведова Н. Ю. Толковый словарь русского языка: 80 000 слов и фразеологических выражений / Российская академия наук. Институт русского языка им.

B.В.Виноградова.— 4-е изд., дополненное. М.: Азбуковник, 1999.

23.Панкрухин А.П.: Муниципальное управление: маркетинг территорий. М.: Логос, 2002.

24.Панкрухин,А.П. Маркетинг территорий /А. П. Панкрухин. - 2-е изд. М.: Питер, 2006.

25.Пищева Т. Н. «Затрудненное общение». Барьеры восприятия образов политиков // Полис. 2002. No 5.

26.Политический класс в современном обществе / Отв. ред.: О. В. Гаман-Голутвина. М.: РОССПЭН, 2012.

27.Почепцов Г.Г. Теория коммуникации. М.: Ваклер; К.: Рефл-бук, 2001.

28.Рожков И.Я., Кисмершкин В.Г. Бренды и имиджи. М.: «РИП-холдинг», 2006.

29. «Рычащий медведь» на «диком Востоке» (Образы современной России в работах американских авторов: 1992-2007) / Э.Я.Баталов, В. Ю.Журавлева, К. В. Хозинская. М.: Российская политическая энциклопедия (РОССПЭН), 2009.

30.Социальная практика и журналистский текст // Под ред. Я.Н. Засурского, Е.И. Пронина. М., 1990.

31.Степанова И. Рецензия на монографию Э. Галумова «Имидж против имиджа» // «Корпоративная имиджелогия». 2007. № 1.

32.Страусе А., Корбин Дж. Основы неформализованного исследования: обоснованная теория, процедуры и техники / Пер. с англ. и послесловие Т. С. Васильевой. М.: Эдиториал УРСС, 2001.

33.Федоров A.B. Трансформация образа России на западном экране: от эпохи идеологической конфронтации (1946-

1991) до современного этапа (1992-2010). М.: Изд-во МОО «Информация для всех», 2010.

34.Andrieu С., Freitas N.D., Doucet A., Jordan М. An introduction to MCMC for machine learning. Journal of Machine Learning // Machine Learning. 2003. Vol. 50. № 1. P. 5-43.

35.Anholt S. Forward // Journal of Brand Management. 2002. №9. P. 229-239.

36.Ansolabehere S., Shanto 1. Going negative: How political advertisements shrink and polarize the electorate. New York, NY: Simon & Schuster. 1995.

37.Attride-Stirling J. Thematic networks: an analytic tool for qualitative research // Qualitative Research. 2001. Vol. 1. P. 385-405.

38.Ayer A. Logical positivism. New York: The Free Press, 1959.

39.Berinsky, Huber, Lenz. Using mechanical turk as a subject recruitment tool for experimental research // Political Analysis. 2012. No 20. P. 351-368.

40. Bernard H., Ryan, G. Text analysis: Qualitative and quantitative methods. In H. R. Bernard (Ed.), Handbook of methods in cultural anthropology WalnutCreek, С A: AltaMiraPress, 1998. P. 595-645.

41 .Blei D., Ng A., Jordan M. Latent Dirichlet Allocation //Journal of Machine Learning Research. 2003. Vol. 3. P. 993-1022.

42.Bing L. Sentiment Analysis and Opinion Mining, Morgan & Claypool Publishers, May 2012.

43.Boyi E., Hens P., Deschacht, Moens M. Automatic sentiment analysis in on-line text // Proceedings of the 11th International Conference on Electronic Publishing. 2007. P. 349-360.

166

44.Boyatzis R.E.: Transforming qualitative information: thematic analysis and code development. Sage, 1998.

45.Braun, V., Clarke V. Using thematic analysis in psychology. Qualitative Research in Psychology, 2006. Vol. 3. No 2, P. 77101.

46.Brewer J., Hunter A. Multimethod research: A synthesis of styles. Newbury Park, CA: Sage, 1989.

47.Burke J., Onwuegbuzie A. Mixed Methods Research: A Research Paradigm Whose Time Has Come // Educational Researcher. 2004. Vol. 33. No. 7. P. 14-26.

48.Burman E., Parker I., editors Discourse analytic research: repertoires and readings of texts in action. Routledge. 1993.

49.Burt, Monroe, and Maeda. 2004. Talk's cheap: Text-based estimation of rhetorical ideal points. Paper presented at the 21st annual summer meeting of the Society of Political Methodology, 2004.

50.Burr V. An introduction to social constructionism. Routledge, 1995.

51.Carley K. Smart agents and organizations of the future.In L. Lievrouw & S. Livingstone (Eds.), The handbook of new media. ThousandOaks, CA: Sage, 2002. P. 206-220.

52.Campbell D., Stanley J. Experimental and quasi-experimental designsfor research. Chicago, IL: Rand McNally, 1963.

53.Charmaz K. Qualitative interviewing and grounded theory analysis. In Gubrium, J.F. and Holstein J.A., editors, Handbook of interview research: context and method. Sage, 2002. P. 675-694.

54.Clarke V., Kitzinger C. Lesbian and gay parents on talk shows: resistance or collusion in heterosexism? // Qualitative Research in Psychology. 2004. Vol. 1. No. 3. P. 195-217.

55.Cottam M.L., Cottam R.W. Nationalism and Politics: the Political Behavior of Nation States. Boulder. L. 2001.

56.Creamer E., Ghoston M. Using a Mixed Methods Content Analysis to Analyze Mission Statements From Colleges of Engineering // Journal of Mixed Methods Research, 2013. P. 15-28.

57.Creswell J. Research design: Qualitative, quantitative, and mixed approaches. Thousand Oaks, CA: Sage, 2003.

58.Daud A., Li J., Zhou L., Muhammad F. Knowledge discovery through directed probabilistic topic models: a survey. // Journal of Frontiers of Computer Science in China (FCS). 2010. Vol. 4, №2. P. 280-301

59.Eggers, Hainmueller. MPs for sale? Returns to office in postwar British politics // American Political Science Review. Vol. 103. No 4. P. 513-533.2009.

60.Eshbaugh-Soha M. The tone of local presidential news coverage // Political Communication. 2010. Vol. 27. No. 2. P. 121-140.

61.Frith H., Gleeson K. Clothing and embodiment: men managing body image and appearance // Psychology of Men and Masculinity. 2004. Vol. 5. P. 40-48.

62. Fry G., Chantavanich S., Chantavanich A. Merging quantitative and qualitative research techniques: Toward a new research paradigm // Anthropology and Education Quarterly. 1981, Vol. 12. P. 145-158.

63.Gans H. Urban villagers: Group life and class in die life of Italian-Americans. New York: Free Press, 1963.

64.Go A., Bhayani R., Huang L. Twitter sentiment classification using distant supervision // CS224N Project Report, Stanford, 2009.

65.Grau C. What publications are most frequently quoted in the Congressional Record // Journalism Quarterly. 1976. Vol. 53. P. 716-719.

66.Greene J., Caracelli V., Graham W. Toward a con-ceptual framework for mixed-method evaluation designs // Educational Evaluation and Policy Analysis. 1989. Vol. 11. P. 255-274.

67.Griffiths T., Steyvers M. Finding scientific topics // Proceedings of the National Academy of Sciences. 2004. № 101. P. 5228-5235.

68.Grimmer J. Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts (with Brandon Stewart) Political Analysis, 2013. Vol. 21. No 3. P.267—297.

69.Grimmer J. King G. General purpose computer-assisted clustering and conceptualization. Proceedings of the National Academy of Sciences. 2011. Vol. 108. No 7. P. 43-50.

70.Guba E., Lincoln Y. Fourth generation evaluation. Newbury Park, CA: Sage, 1989.

71.Guba E. The alternative paradigm dialog. In E. G. Guba (Ed.), The paradigm dialog. Newbury Park, CA: Sage, 1990. P. 1727.

72.Guest G., MacQueen K., Namey E. Applied thematic analysis. Thousand Oaks, California: Sage. 2012.

169

73.Hatzivassiloglou V., Wiebe J. Effects of adjective orientation and gradability on sentence subjectivity. In Proceedings of the 18th conference on Computational linguistics. 2000. Vol. 1. P. 18-23.

74.Hillard D., Purpura S., Wilkerson J. Computer-assisted topic classification for mixed-methods social science research // Journal of Information Technology & Politics. 2008. Vol.4. No. 4. P. 31^46.

75.Hogenraad R. What the Words of War Can Tell Us About the Risk of War // Peace and conlict: Journal of peace psychology. 2005. Vol. 11. No. 2. P. 137-151.

76.Hofmann T. Probabilistic latent semantic indexing // Proceedings of the 22nd Annual International ACMSIGIR Conference on Research and Development in information Retrieval 1999. Vol. 50. No. 7.

77.Hollingshead A. Elmtown's youth. New York, 1949.

78.Hopkins D., King G. Extracting systematic social science meaning from text // American Journal of Political Science. 2010. Vol. 54. No 1. P. 229-247.

79.Hoshmand L. Can lessons of history and logical analysis ensure progress in psychological science? // Theory and Psychology. 2003. Vol. 13. P. 39-44.

80.Howard, Iker, Kleinwords: A computer system for the analysis of content // Behavior Research Methods & Instrumentation. 1974. Vol. 6. No. 4. P. 430-438.

81.Howe K. Against the quantitative-qualitative incompatabil-ity thesis, or, Dogmas die hard // Educational Researcher. 1988. Vol. 17. P. 10-16.

82.Hu M., Bing L. Mining and summarizing customer reviews. In Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining ACM. 2004.

83.Hunter A., Brewer J. Multimethod research in sociology. In A. Tashakkori & C. Teddlie (Eds.), Handbook of mixed methods in social and behavioral research. Thousand Oaks, CA: Sage, 2003. P. 577-594.

84.Hutchby I., Wooffitt R. Conversation analysis: principles, practices and applications. Polity Press, 1998.

85.Jones L.K. Theme in English Expository Discourse. Lake Bluff, 111: Jupiter Press, 1977.

86.Johnson R., Turner L. Data collection strategies in mixed methods research. In A.Tashakkori, and C. Teddlie (Eds.), Handbook of mixed methods in social and behavioral research. Thousand Oaks, CA: Sage, 2003. P. 297-319.

87.Johnson R., Christensen L. Educational research: Quantitative, qualitative, and mixed approaches. Boston, MA: Allyn and Bacon, 2004.

88.Jonathan, Boyd-Graber, Wang, Gerrish, and Blei. Reading tea leaves: How humans interpret topic models. In Advances in neural information processing systems, eds. Y. Bengio, D. Schuurmans, J. Lafferty, C. K. I. Williams, and A. Culotta, Cambridge, MA: The MIT Press. 2009. P: 288-96.

89.Jurafsky D., Martin J. Speech and natural language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River, NJ: Prentice Hall. 2009.

90.Jurka Т., Collingwood L., Boydstun A., Grossman A., Atteveldt. R Text Tools: Automatic text classification via supervised learning. URL: http://cran.r-project.org/web/packages/RTextTools/index.html (дата обращения 29.05.2014).

91.Kaufer D., Carley K. Communication at a Distance: The Effect of Print on Socio-Cultural Organization and Change, Hillsdale, NJ: Lawrence Erlbaum Associates, 1993.

92.Krippendorff K. Content Analysis: An Introduction to Its Methodology. 2ndedition, Thousand Oaks, CA: Sage 2004.

93.Laver M., Benoit K., Garry J. Extracting policy positions from political texts using words as data. American Political Science Review. 2003. Vol. 97. No. 2. P.311-31.

94.Leff L. Buried by the Times: the Holocaust and America's most important newspaper. New York: Cambridge University Press, 2005.

95.Lincoln Y., Guba E. Naturalistic inquiry. Beverly Hills, CA: Sage, 1985.

96.Lincoln Y., Guba E. Paradigmatic controversies, contradictions, and emerging confluences. In N. K. Denzin, and Y. S. Lincoln (Eds.), Handbook ofqualitative research. Thousand Oaks, CA: Sage, 2000. P. 163-188.

97.Loughran Т., McDonald B. When is a liability not a liability? Textual analysis, dictionaries, and 10-Ks // Journal of Finance. 2011. Vol. 66. No. 1. P. 35-65.

98.Macionis J. Sociology. 10th ed. Upper Saddle River, New Jersey: Pearson Prentice Hall. 2005.

99.Manning C., Raghavan P., Schutze H. Introduction to information retrieval. Cambridge, UK: Cambridge University Press. 2008.

100. McLeod J. Qualitative research in counselling and psychotherapy. Sage, 2001.

101. Miller M., Riechert B. Identifying Themes Via Concept Mapping: A New Method of Content Analysis. Association for Education in Journalism and Mass Communication Annual Meeting. 1994.

102. Monroe, Burt, Colaresi, Quinn. Fightin' words: Lexical feature selection and evaluation for identifying the content of political conflict // Political Analysis. 2008. Vol. 16. No. 4. P. 372.

103. Morse J. Approaches to qualitative-quantitative methodological triangulation // Nursing Research. 1991. Vol. 40. P. 120-123.

104. Morse J. Principles of mixed methods and multimethod research design. In A. Tashakkori & C. Teddlie (Eds.), Handbook of mixed methods in social and behavioral research (pp. 189-208). Thousand Oaks, CA: Sage, 2003. P. 189-208.

105. Mosteller F., Wallace D. Inference in an authorship problem // Journal of the American Statistical Association. 1963. No. 58. P. 275-309.

106. Murray M. Narrative psychology. In Smith, J.A., editor, Qualitative psychology: a practical guide to research methods. Sage, 2003.

107. Nagel T. The view from nowhere. New York: Oxford University Press, 1986.

108. Narayanan R, Liu B. and Choudhary A. Sentiment Analysis of Conditional Sentences // Proceedings of the Conference on Empirical Methods in Natural Language Processing. 2009. P. 180-189.

109. Newman I., Benz C. Qualitative-quantitative research methodology: Exploring the interactive continuum. Carbondale, IL: Southern Illinois University Pres, 1998.

110. Onwuegbuzie A. Validity and qualitative research: An Oxymoron? Paper presented at the annual meeting of the Association for the Advancement of Educational Research (AAER), Ponte Vedra, Florida, 2000.

111. Onwuegbuzie A. Expanding the framework of internal and external validity in quantitative research // Research in the Schools. 2003. Vol. 10. P. 71-90.

112. Onwuegbuzie A., Jiao Q., Bostick S. Library anxiety: Theory, research, and applications. Lanham, MD: Scarecrow Press, 2004.

113. Quinn, Kevin. How to analyze political attention with minimal assumptions and costs // American Journal of Political Science. 2010. Vol. 54. No. LP. 209-228.

114. Pang, B., Lee, L. A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts // Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics Association for Computational Linguistics. 2004. p. 271.

115. Pang, B., Lee L., Vaithyanathan S. Thumbs up?: Sentiment classification using machine learning techniques. Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing. 2002. Vol. 10. P. 79-86.

174

116. Patton, M.Q. Qualitative evaluation and research methods, second edition. Sage, 1990.

117. Popping R. Computer-assisted text analysis. London: SAGE Publications, 2000.

118. Porter M. An algorithm for suffix stripping // Program. 1980. Vol. 14. No. 3. P. 130-37.

119. Potter J., Wetherell M. Discourse and social psychology: beyond attitudes and behaviour. Sage, 1987.

120. Read J., Carrol J. Weakly supervised techniques for domain-independent sentiment classification. In Proceeding of the 1st international CIKM workshop on Topic-sentiment analysis for mass opinion, 2009.

121. Riessman C.K. Narrative analysis. Sage, 1993.

122. Riffe, D., Lacy, S., & Fico, F. G. Analyzing media messages: quantitative content analysis in research. Mahwah, NJ: Lawrence Erlbaum, 1998.

123. Rubin H., Rubin I. Qualitativeinterviewing: the art of hearing data. Sage, 1995.

124. Ryan G, Bernard H. Data management and analysis methods. In Denzin, N.K. and Lincoln, Y.S., editors, Handbook of qualitative research, second edition. Sage, 2000.

125. Sandelowski M. Tables or tableaux? The challenges of writing and reading mixed methods studies. In A. Tashaklcori & C. Teddlie (Eds.), Handbook of mixed methods in social and behavioral research. Thousand Oaks, CA: Sage, 2003. P. 321-350.

126. Schrag F. In defense of positivist research paradigms // Educational Researcher. 1998. Vol. 21. No. 5. P. 5-8.

127. Schrodt P. Pattern recognition of international crises using Hidden Markov Models. In Political complexity: Nonlinear models of politics, ed. Diana Richards, Ann Arbor, MI: University of Michigan Press. 2000. P. 296-328.

128. Schwandt T. Three epistemological stances for qualitative inquiry: Interpretivism, hermeneutics, and social constructionism. In N. K. Denzin & Y. S. Lincoln, Handbook of qualitative research. Thousand Oaks, CA, 2000. P. 189-213.

129. Semmel A. Foreign news in four U.S. elite dailies: some comparisons // Journalism Quarterly. 1976. Vol. 53. P. 732736.

130. Siebert F., Peterson T., Schramm W. Four Theories of the Press. Urbana, University of Ilinois Press, 1963.

131. Simon J. Data from Web into R // The Political Methodologist. 2006. Vol. 14. No 2. P. 11-15.

132. Singer D., Hunter M. The experience of premature menopause: a thematic discourse analysis // Journal of Reproductive and Infant Psychology. 1999. Vol. 17. No. 63. P. 42-57.

133. Smith J. Quantitative versus qualitative research: An attempt to clarify the issue // Educational Researcher. 1983. Vol. 12. P. 6-13.

134. Smith J. The problem of criteria forjudging interpretive in-quiry // Educational Evaluation and Policy Analysis. 1984. Vol. 6. P. 379-391.

135. Stone P., Dunphy D., Smith M., Ogilvie D. The general inquirer: A computer approach to content analysis. Cambridge, MA: The MIT Press. 1966.

136. Taboada M., Grieve J. Analyzing appraisal automatically. In Proceedings of AAAI Spring Symposium on Exploring Attitude and Affect in Text (AAAI Technical Report SS-04-07), 2004.

137. Tashakkori A., Teddlie C. Mixed methodology: Combining qualitative and quantitative approaches. Applied Social Research Methods Series. Thousand Oaks, CA: Sage, 1998.

138. Tashakkori A., Teddlie C. (Eds.). Handbook ofmixed methods in social and behavioral research. Thousand Oaks, CA: Sage, 2003.

139. Taylor G., Ussher J. Making sense of S&M: a discourse analytic account // Sexualities. 2001. Vol. 4. P. 293-314.

140. Tesch R. Qualitative research: Analysis types and software tools. New York: Falmer Press, 1990.

141. Text Analysis for the Social Sciences: Methods for Drawing Statistical Inferences From Texts and Transcripts (Routledge Communication Series) edit by Carl W. Roberts, 1997.

142. Thomas R. Blending qualitative and quantitative research methods in theses and dissertations. Thousand Oaks, С A: Corwin, 2003.

143. Top 200 Newspapers in the world [Электронныйресурс], 2013. Режим доступа: http://www.4imn.com/top200/.

144. Tuckett A. Applying thematic analysis theory to practice: a researcher's experience // Contemporary Nurse. 2005. Vol. 19. P. 75-87.

145. Turney P. Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews. In Proceedings of Annual Meeting of the Association for Computational Linguistics, ACL. 2002. P. 417-424.

146. Van Dijk T. Ideology: A Multidisciplinary Approach. London: Sage, 1998.

147. Van Dijk T.A., Kintsch W. Strategies of Discourse Comprehension. New York: Academic Press, 1983.

148. Weber R.P. Computer-aided content analysis: Ashortprimer // Qualitative Sociology. Spring and Summer. 1984. Vol. 7. No. 1-2. P. 126-147.

149. Weiss C. What America's leaders read // Public Opinion Quarterly. 1974. Vol. 38. P. 1-22.

150. Wiebe M., Bruce R., & O'Hara T. Development and use of a gold standard data set for subjectivity classifications. In Proc. 37th Annual Meeting of the Assoc. for Computational Linguistics (ACL-99). Association for Computational Linguistics, University of Maryland, June, 1999. P. 246-253.

151. Wiley, Jahoda, Lazarsfeld, Zeisel, (1931/2003). Marienthal: The sociography of an unemployed community. New Brunswick, NJ: Transaction Publishers

152. Weller S., Romney A. Systematic data collection. Newbury Park, CA: Sage, 1988.

153. Williams R. American Society: A Sociological Interpretation, 3rd edn. NewYork: Alfred A. Knopf, 1970.

154. Willig C. Discourse analysis. In Smith, J.A., editor, Qualitative psychology: a practical guide to research methods. Sage. 2003.

155. Winter J., Eyal C. Agenda setting for the civil rights issue. Public Opinion Quarterly. 1981. Vol. 45. P. 376-38.

156. Zhang C., Meadows C.W. International Coverage, Foreign Policy, and National Image: Exploring the Complexities of Media Coverage, Public Opinion, and Presidential Agenda // International Journal of Communication. 2012. No 6. P. 76-95.

157. Zhao J., Liu K., Wang G. Adding redundant features for CRFs-based sentence sentiment classification // Proceedings of the Conference on Empirical Methods in Natural Language Processing. 2008. P. 117-126.

Приложение 1. Пересечение тем и ценностей в статьях о России «Нью-Йорк тайме» в период 2011-2012 гг.

Частота Ценности Тема Равные возможности Прогресс Демократия и свободное предпринимательство Свобода Гуманизм Чрезмерная религиозность Экология Безопасность

61,0 Внутренняя политика 2.0 2.0 88,0 34,0 2,0 4,0 0,0 0,0

33,3 Митинги, протесты 0.0 0,0 100.0 18,5 0,0 0,0 0,0 0,0

9.5 Культура 0,0 0,0 66.7 100,0 0,0 0,0 0.0 16.7

8,6 Внешняя политика 0,0 0,0 16,7 33,3 0,0 0,0 0,0 66,7

7.6 Распад СССР 0,0 0,0 57.1 28,6 0,0 28,6 0.0 14,3

6,7 Экономика России 0,0 0,0 100.0 50,0 0,0 0,0 0.0 0,0

4.8 Россия и США 0.0 0,0 60,0 40,0 0,0 20.0 0.0 20,0

2,9 Пиратство, авторские права 0.0 0,0 0,0 100,0 0.0 0,0 0.0 0.0

2,9 Бизнес и власть 0,0 0,0 100,0 0.0 0.0 0,0 0,0 0,0

2.9 Наводнение в Крымске 0,0 0,0 0,0 0,0 100,0 0.0 0,0 0,0

1,9 Наука 0.0 0,0 0,0 100.0 0.0 0.0 0,0 0.0

1,9 Россия и Сирия 0.0 0.0 0,0 0.0 0.0 0.0 0,0 100,0

1,9 Российская деревня 50.0 0,0 0,0 50,0 0.0 50,0 0,0 0,0

1,9 РПЦ 0.0 0,0 0,0 50.0 0,0 100,0 0,0 0,0

1,0 Экология 0.0 0,0 0.0 0,0 0,0 0,0 100,0 0,0

1,0 Проблема миграции 0.0 0,0 0,0 100.0 0,0 0,0 0.0 0,0

1.0 Жизнь русских в США 0,0 0,0 0,0 100,0 0,0 0.0 0.0 0,0

Приложение 2 Индикаторы репрезентаций ценностей американского общества в статьях «Нью-Йорк тайме» о России, пример_

Тема Ценность Пример речевого маркера

Внутренняя политика, выборы протесты Демократия и свободное предпринимательство (Democracy and free enterprise). Свобода (Freedom) his opponents will be Kremlin stooges, protest movement, antigo\ eminent protests. Putin regime the persecution of the opposition. political detainees, anti-national authorities, non-free country public pressure government control, discrimination (journalists, homosexuals, gypsies, intellectuals, etc), laws against gay "propaganda", most of the laws that could be seen as anti-gay actually threaten the human rights of citizens gay and straight.blatantly discriminatory legislation

Внешняя политика Безопасность (safety), militarized Russia, omnipotence of the armed forces, foreign threat

Экономическая политика России, возможности бизнеса с Россией Свобода (Freedom), Прогресс (Progress,), Материальный комфорт (Material Comfort Success). Демократия и свободное предпринимательство (Democracy and free enterprise). технологи 21 века (21st Century Technology) human rights (violation, improvement, deterioration) gives Russia access to Exxon's sophisticated project management, capital discipline and technologies" he said ' These have not been the hallmarks of Russian national oil companies" political persecution, censorship, falsification in national elections political controls on national newspapers,

Наводнение (в т ч добровольчес тво. новое поколение в России) Демократия и свободное предпринимательство (Democrac> and free enterprise). 1 уманизм (Humanitarianism), new sensibihtv -- the idea that citizens can organize, be responsible for one another, and ultimately have an effect on how Russia governs itself, the response from many Russians -- particular!v young people -- was different From manv comers ot the country, groups organized humanitarian aid and descended on Krymsk to help, rather than wait for incompetent government functionaries to fail, new volunteerism mav already be catching unwanted attention from Russian officials, Today's volunteers seem to be groping for a larger definition of citizenship If some day Russia changes the way it is governed, one can only hope that whatever comes to replace Mr Putin and his cronies will include the social conscious-ness of this emerging new generation many young Russians a consciousness of their responsibilities toward society and a desire for the government to uphold its obligations to its citizens Buoyed by social networks and new communities they are creating what could become a blueprint for a new form oi civil society

Экология эколог и я (эко-образ жизни) cnviionmental problems, pollution in cities, worsening air quality, has suffered a severe breakdown in environmental health, overfishing and forest loss.

Церковь чрезмерная религиозность (religiosity), Демократия и свободное предпринимательство (Democracy and free enterprise). Свобода (Freedom) to register as a political party to promote Orthodox values in politics, signs of ostentatious wealth a wave of protests alleging election fraud,

Олигархи в России Равные возможности (Equal Opportunity) a timely marriage, a close family member or a friend in government is a plus In other words, if you want deal-making riches you may want to start with the government on your side, overnment assets in privatizations and close government ties

Упадок сельского хозяйства llpoipeec (Progress) a dying village, one of many in the Russian countryside left behind by an oil-driven boom that revitalized drab Soviet cities and drew the young away from the farms that had sustained their parents collective farms routinely go bankrupt, log houses tilt and sink into the soil, roads become muddy ravines and village stores make much of their money selling vodka, a scene of rural penury, Most of the village never had running water.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.