Изучение предпочтений аудитории как фактор деятельности редакций онлайн-СМИ (на примере РБК) тема диссертации и автореферата по ВАК РФ 10.01.10, кандидат наук Шароян Сирануш Вардановна
- Специальность ВАК РФ10.01.10
- Количество страниц 143
Оглавление диссертации кандидат наук Шароян Сирануш Вардановна
ВВЕДЕНИЕ...................................................................................................................................3
ГЛАВА I. ЭВОЛЮЦИЯ ОТНОШЕНИЙ СМИ С АУДИТОРИЕЙ В ЦИФРОВУЮ ЭПОХУ........................................................................................................................................18
§1.1. Взаимоотношения редакций СМИ с аудиторией в доцифровую эпоху..............19
§1.2. Способы измерения аудитории, применяемые традиционными СМИ до
появления систем веб-аналитики...............................................................................................26
§1.3. Процесс редакционного отбора новостей и классические критерии новостной
ценности событий........................................................................................................................34
§1.4. Рыночные и технологические предпосылки «рационализации» аудитории.......44
§1.5. Переход СМИ от «смутных представлений» к точным данным об аудитории..50
§1.6. Возможности анализа аудитории с помощью систем веб-аналитики.................58
ГЛАВА II. СОВРЕМЕННЫЕ ПРАКТИКИ ИСПОЛЬЗОВАНИЯ ДАННЫХ ВЕБ-АНАЛИТИКИ ДЛЯ ИЗУЧЕНИЯ АУДИТОРИИ................................................................68
§2.1. Декларируемые и воспринимаемые критерии качества материалов (на примере
российских деловых СМИ).................................................................................................69
§2.2. Изменения редакционных процессов, обусловленные внедрением
инструментов веб-аналитики (на примере сайта РБК)............................................................83
§2.3. Определение факторов читательских предпочтений с помощью инструментов
веб-аналитики..............................................................................................................................92
ЗАКЛЮЧЕНИЕ.......................................................................................................................125
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
12929
Рекомендованный список диссертаций по специальности «Журналистика», 10.01.10 шифр ВАК
Особенности медиапотребления современной российской молодежи (на примере Москвы и Московской области)2019 год, кандидат наук Вьюгина Дарья Михайловна
Управление процессами создания журналистского текста в печатных и онлайновых СМИ2017 год, кандидат наук Вырковский, Андрей Владимирович
Особенности новостного телеканала в социальных сетях (на примере «Аль-Джазиры»)2023 год, кандидат наук Алшакарна Ахмед А.И.
Трансформации международной журналистики в качественной прессе в начале XXI столетия: российские реалии в международном контексте2022 год, кандидат наук Колесниченко Виктория Геннадьевна
ТЕНДЕНЦИИ В КОЛУМНИСТИКЕ США НА ПРИМЕРЕ МАТЕРИАЛОВ «НЬЮ-ЙОРК ТАЙМС», ПОСВЯЩЕННЫХ КИТАЮ И РОССИИ (2008—2013 гг.)2016 год, кандидат наук Кошкин Павел Геннадьевич
Введение диссертации (часть автореферата) на тему «Изучение предпочтений аудитории как фактор деятельности редакций онлайн-СМИ (на примере РБК)»
ВВЕДЕНИЕ
Актуальность исследования. Одной из ключевых задач средств массовой информации на современном этапе развития стало сохранение и увеличение своей аудитории, от размеров и качества которой зависят доходы изданий, а значит их экономическая состоятельность. Для достижения этой цели СМИ должны максимально четко понимать, что из себя представляет их аудитория, а также уметь определять ее предпочтения. Ключевыми инструментами, позволяющими получить такую информацию на сегодняшний день являются системы веб-аналитики, которые западные онлайн-издания стали внедрять в середине 2000-х гг.
В этот период традиционные средства массовой информации столкнулись с радикальными технологическими и экономическими изменениями, которые оказали заметное влияние на редакционную деятельность в целом и отношения редакций с аудиторией в частности. Первым фактором, спровоцировавшим трансформацию, стали экономические сложности, с которыми издания столкнулись на фоне снижения доходов от рекламы и продаж, и усиления конкуренции не только со стороны растущего числа новых СМИ, но и со стороны альтернативных рекламных площадок, таких как социальные сети и онлайн-базы объявлений. Новые реалии заставили журналистов и редакторов более тщательно изучать предпочтения аудитории и даже начать к ним прислушиваться1.
Вторым фактором трансформации стали растущая популярность онлайн-изданий и появление технологически усовершенствованных инструментов веб-аналитики. До их распространения возможности СМИ в точном и многогранном измерении своей аудитории, а тем более выявлении ее предпочтений, были сильно ограничены - данные пытались получить, анализируя продажи изданий или рейтинги программ в отдельные дни, а
1 Hamilton, J. T. All the News That's Fit to Sell: How the Market Transforms Information into News. Princeton: Princeton University Press, 2004.
также делая отрывочные выводы из писем, присылаемых в редакции2, но этого было недостаточно для понимания того, чего от изданий хотят читатели, слушатели или зрители. В свою очередь системы веб-аналитики позволяют не только точнее определить размер и демографические характеристики аудитории, но и довольно эффективно выявить темы и даже конкретные материалы, которые вызывают у нее наибольший интерес. Благодаря технологической революции, СМИ получили колоссальный объем данных о людях, для которых они делают свой продукт. Грамотный анализ этих данных может оказаться ключом к построению максимально продуктивных отношений со своей аудиторией, а значит и к сохранению устойчивости изданий3.
На российском медиарынке процесс трансформации отношений редакций СМИ с аудиторией начался на фоне снижения размеров аудитории и доходов традиционных СМИ после финансового кризиса 2008 года. С тех пор рекламные доходы печатных изданий сократились почти на 70%4. Телевидение, хоть и остается основным источником информации, тоже теряет аудиторию: новости по телевизору теперь узнает только половина россиян5. При этом продолжает расти популярность интернет-изданий, а с ней и доходы онлайн-изданий от рекламы. По прогнозам исследовательской компании НСК, онлайновые медиа в 2018 году могли впервые обогнать телевидение по размеру рекламных доходов, увеличив долю на рекламном рынке до 42%6.
Во многом такой рост популярности онлайн-изданий связан с тем, что именно их редакции с помощью инструментов веб-аналитики могут получить максимальное количество данных о своей аудитории, изучить ее
2 Gans H. J. Deciding What's News. Chicago, IL: Northwestern University Press, 2004.
3 Welbers K., Van Atteveldt W., Kleinnijenhuis J., Ruigrok N., Schaper J. News selection criteria in the digital age: Professional norms versus online audience metrics. Journalism. 17 (8). 2015. Pp. 1037-1053.
4 Рекламный рынок России 2000 [электронный ресурс] // АКАР, 2018. URL: http://www.akarussia.ru/node/7849 (дата обращения 20.02.2019).
5 Интернет против телевидения: битва продолжается [электронный ресурс] // ВЦИОМ, 2018. URL: https://wciom.ru/index.php?id=236&uid=116190 (дата обращения 20.02.2019).
6 Прогноз НСК: Интернет впервые обойдет ТВ [электронный ресурс] // TAdviser, 2018. URL: https://clck.ru/FNDEz (дата обращения 20.02.2019)
предпочтения и подстроиться под них. Наблюдение за опытом работы с веб-аналитикой одного из крупнейших российских онлайн-СМИ, позволяет понять, как эти инструменты влияют на редакционные процессы, и как меняется работа журналистов, когда они ориентируются на предпочтения читателей.
Степень разработанности темы. На Западе на протяжении последних двух десятилетий исследователи пытаются проследить за тем, как редакции используют в работе системы веб-аналитики и оценить влияние этих инструментов на редакционные процессы и отношения редакций с аудиторией. В России, однако, рассматриваемая в работе автора проблема разработана слабо. Отечественные исследователи практически не анализировали влияние собираемых с помощью систем веб-аналитики данных, а соответственно и читательских предпочтений, на редакционную работу в российских СМИ.
При подготовке теоретической части работы автор опирался на монографии, сборники и статьи с исследованиями российских и иностранных ученых. Задействованные в работе источники можно условно разделить на три группы. В первую группу источников автор включил труды исследователей об особенностях отношений редакций традиционных средств массовой информации со своей аудиторией в доцифровую эпоху. Составить представление об этих отношениях, в первую очередь, помогает ряд этнографических наблюдений, которые исследователи СМИ проводили в 1970-80-е годы. Они показывают, как мало журналисты и редакторы на самом деле знают о своей аудитории. Так, американский исследователь К. Андерсон, опираясь на серию длительных наблюдений за работой редакций различных СМИ и десятки глубинных интервью с сотрудниками редакций этих изданий, пишет, что «отношения между производителями контента СМИ и его потребителями можно описать как «непонимание, построенное на
игнорировании» . С его выводами соглашается Ф. Шлезингер из Университета Глазго, который отмечает, что «журналисты делают продукт не для своей аудитории, а для других журналистов, своего руководства,
о
своих источников, пока аудитория остается какой-то абстракцией» . Яркие иллюстрации этих выводов в своих наблюдениях приводят У. Лоури9, Д. Сингер10 и др.
Разрозненные выводы, сделанные коллегами, обобщает Г. Ганс, автор знаменитого труда «Что такое новости» (Deciding What's News), сформировавшего классическую академическую позицию об отношениях редакций СМИ с собственной аудиторией. На основе наблюдений за редакционной жизнью американских каналов Си-Би-Эс (CBS) и Эн-Би-Си (NBC), а также журналов «Ньюсвик» (Newsweek) и «Тайм» (TIME) Г. Ганс пишет, что «был удивлен тем, как мало журналисты знают о своей аудитории и как упорно они отказываются воспринимать обратную связь»11. Журналисты игнорируют как качественные, так и количественные исследования аудитории, предпочитая выбирать темы для освещения на основе обсуждений с коллегами и начальством, предполагая, что нечто, способное заинтересовать их, будет привлекать и аудиторию, пишет Г. Ганс.
Этот факт особенно негативен, учитывая, что вкусы сотрудников средств массовой информации и их аудитории очень часто не совпадают, что
12 13
подтверждается исследованиями Дж. Сингер , Л. Богарта и других медиаисследователей.
7 Anderson, C. W. Between creative and quantified audiences: Web metrics and changing patterns of newswork in local US newsrooms. Journalism, 12(5), 2011, p. 550-566
8 Shlezinger P. Putting 'Reality' Together: BBC News. New-York: Methuen, 1987
9 Lowrey, W. Institutional roadblocks: Assessing journalism's response to changing audiences. In Papacharissi (Ed.), Journalism and citizenship: New agendas. Mahwah, NJ: Lawrence Erlbaum, 2009
10 Singer, J. B. Quality control: Perceived effects of user-generated content on newsroom norms, values and routines. Journalism Practice. 4(2). 2010. Pp. 127-142
11 Gans H. J. Deciding What's News. Chicago, IL: Northwestern University Press, 2004.
12 Singer, J. B. Quality control: Perceived effects of user-generated content on newsroom norms, values and routines. Journalism Practice. 4(2). 2010. Pp. 127-142
13 Bogart, L. Opinion research and marketing. Public Opinion Quarterly, 21(1), 1957, 129-140
Помимо этнографических наблюдений, автор опирался на академические труды, посвященные особенностям отношений редакций СМИ со своей аудиторией. Несколько знаковых научных работ в этой сфере было написано американскими медиаисследователями П. Шумейкер и С. Ризом14, которые обобщили данные исследований, заложивших основу теории «гейткипинга» (в частности, теорий Д. Уайта15, У. Гибера16, Дж.
17 1Я 10
МакНелли , А. Басса , П. Шнайдера и др.). В первую группу источников, на которые автор опирался при написании работы, он также включил
исследования о критериях оценки новостной ценности различных событий.
20
Классический труд норвежских исследователей Д. Галтунга и М. Руж, опубликованный еще в 1965 году, содержит в себе, пожалуй, самый полный список факторов, которые принимают во внимание журналисты при оценке информации. Именно это исследование легло в основу многих научных
работ, посвященных анализу критериев новостной ценности любой
21 22
информации - например, исследований А. Белла , Дж. Палмера , Дж.
23
Тунсталла и др. В 2001 г. проведенное Дж. Галтунгом и М. Руж исследование было актуализировано британцами Т. Харкапом и Д.
24
О'Ниллом , которые провели контент-анализ трех крупных национальных газет Великобритании и выяснили, что за 35 лет, прошедших с момента публикации исследования норвежских классиков, критерии, по которым
14 Shoemaker P., Reese S. Mediating the Message: Theories of Influences on Mass Media Content, 2nd edn, White Plains, - NY: Longman, 1996
15 White, D. "The "gate keeper": A case study in the selection of news". Journalism Quarterly. 27. 1950. Pp. 383 -391.
16 Gieber, W. Across the desk: a study of 16 Telegraph editors. Journalism Quarterly. 33(4). 1956. Pp. 428-433.
17 McNelly, J. T. Intermediary Communicators in the International Flow of News. Journalism Quarterly 36(1). 1959. Pp.23-26
18 Bass, A. Redefining the gatekeeper concept: A U.N. radio case study. Journalism Quarterly. 46. 1969. Pp. 59-72
19 Snider, P. Mr. Gates revisited: A 1966 version of the 1949 case study. Journalism Quarterly. 44(3). 1967. Pp. 419427.
20 Galtung J., Ruge M.H. The structure of foreign news: The presentation of the Congo, Cuba and Cyprus crises in four Norwegian newspapers. Journal of Peace Research. 2(1). 1965. Pp. 64-90
21 Bell A. The language of news media. Oxford: Blackwell, 1991.
22
Palmer J. Spinning into control: News values and source strategies. London: Leicester University Press, 2000
23
23 Tunstall J. Journalists at Work. London: Constable, 1971
24
Harcup T. and O'Neill, D 'What is news? Galtung and Ruge revisited', Journalism Studies. 2 (2). 2001. Pp. 261-280
журналисты и редакторы определяют новостную ценность событий, почти не изменились. В 2007 г. предложенный список критериев качества также попыталась актуализировать голландская исследовательница И. Шульц, которая в ходе своих наблюдений пришла к выводу, что большинство редакционных решений журналисты принимают на основе некого «внутреннего чувства», в то время как интересы аудитории практически игнорируются25.
Вторую группу источников, к которым обращался автор, составляют научные статьи и книги о трансформации отношений СМИ с аудиторией, которая произошла в конце начале XXI века., факторах, которые к этой трансформации привели. Фундаментальной трансформации понимания журналистами своей аудитории способствовало распространение интернет-журналистики: интерактивность цифровых каналов настолько выше, чем интерактивность традиционных СМИ, и инструменты, используемые для отслеживания аудитории, настолько совершеннее, что редакции получили огромный объем данных о предпочтениях аудитории, почти не прилагая усилий26, объясняет испанский исследователь Ф. Бермехо.
Голландский исследователь К. Уэлберс совместно с коллегами, анализируя причины происходящих изменений, пишет, что они возникли не только благодаря совершенствованию технологий, позволяющих более точно измерять предпочтения аудиторию, но и из-за экономических сложностей, с которыми столкнулись СМИ на рубеже веков и которые заставили их более
27
внимательно относиться к запросам и интересам своих «клиентов» .
Инструменты веб-аналитики, появившиеся в начале XXI века, позволяют не просто проводить вспомогательную проверку размера аудитории и ее демографии, но проследить ее поведенческие паттерны.
25
Schultz, I. The journalistic gut feeling: Journalistic doxa, news habitus and orthodox news values. Journalism Practice. 1(2). 2007. Pp. 190-207
26 Bermejo, F. Audience manufacture in historical perspective: From broadcasting to Google. New Media & Society. 11(1-2). 2009. Pp. 133-155
27 Welbers K., Van Atteveldt W., Kleinnijenhuis J., Ruigrok N., Schaper J. News selection criteria in the digital age: Professional norms versus online audience metrics. Journalism. 17 (8). 2015. Pp. 1037-1053
«Детализация того, что мы знаем об аудитории сегодня, невероятна. Раньше мы могли видеть только количество уникальных пользователей. Теперь мы получаем данные о страницах, на которые приходят читатели и с которых они уходят, о показателях отказов, о среднем времени, которое аудитория проводит за просмотром видео, о показателях кликабельности отдельных материалов (dick-through rate, или CTR). Все это влияет на то, каким образом
материалы размещаются на сайте и как издания делятся ими в социальных
28
сетях»,28 - отмечает К. Монтгомери. С ней соглашается американский исследователь Ф. Наполи, автор теории «рационализации аудитории», который пишет что развитие технологий стало одной из основных причин включения аудитории в процесс контроля доступа29. Важно и то, что сегодня информация, которую СМИ получают с помощью систем веб-аналитики,
30
более широко распространяется среди сотрудников редакции30. Редакторы и журналисты могут видеть, когда происходят всплески посещаемости сайта и
31
как волны распространяются по разным регионам», - уточняет исследователь систем веб-аналитики А. Кошик.
Этнографические исследования, проводимые уже в начале 2000-х гг. по всему миру, показывают, что теперь информация, полученная с помощью систем веб-аналитики, используется многими редакциями для принятия решений относительно публикуемого контента, и что веб-трафик оказывает сильное влияние на решения, принимаемые сотрудниками редакций. П. Бочковски, последние исследования которого были посвящены газетам в Южной Америке, в своих исследованиях редакционной практики крупных новостных веб-сайтов Clarin.com и Lanacion.com приходит к выводу, что журналисты все больше внимания обращают на то, какие материалы на их
28 Montgomery C. Presentation to the Markkula Center for Applied Ethics. [электронный ресурс] // Santa
Clara University, 2012. URL: http://www.youtube.com/watch?v=dOm9wRXfJY4 (дата обращения 20.06.2018)
29 Napoli, P.M. Audience Evolution: New Technologies and the Transformation of Media Audiences. New York: Columbia University Press, 2011
30 Lee A. M., Lewis S. C., Powers M. Audience Clicks and News Placement. A Study of Time-Lagged Influence in Online Journalism. Communication Research. 41(4). 2014. Pp. 505-530
31 Kaushik A. Web Analytics 2.0: The Art of Online Accountability and the Science of Customer Centricity, Indianapolis: Wiley, 2009.
сайтах пользуются наибольшим успехом . Американские исследователи А. Ли, С. Льюис и М. Пауэрс в свою очередь выяснили, что редакторы, которые контролируют расположение материалов на веб-страницах, часто используют данные о количестве просмотров того или иного материала в
33
качестве ориентира .
К. Андерсон документирует риторический сдвиг к понятию «генеративной, творческой аудитории», у которой есть свое видение того, как должны выглядеть СМИ, появление технологий, позволяющих получить почти бесконечный объем данных об аудитории, и распространение стратегий управления, которые признают значимость показателей веб-счетчиков34. П. Шумейкер соглашается, что можно говорить о формирующихся цифровых формах контроля доступа, на этот раз уже со стороны аудитории. Предпочтения читателей все больше видны не только редакциям, специалистам в области средств информации, их друзьям, но теперь уже и незнакомым людям, например, через списки «самых просматриваемых» или «самых часто перепощиваемых» статьях, которые
35
сами СМИ все чаще показывают на своих главных страницах35.
Наконец, к третьей группе источников можно отнести научные статьи, диссертации и книги, позволяющие проследить историю деловых СМИ в России и определить место сайта Rbc.ru в современной российской системе СМИ. К этой группе в первую очередь относятся работы «Средства массовой информации постсоветской России» под ред. Я.Н. Засурского и «Деловая журналистика» под ред. А.В. Вырковского36. В этих сборниках тщательно проанализированы этапы становления российских деловых медиа.
32 Boczkowski, P. J. News at work: Imitation in an age of information abundance. - Chicago, IL: University of Chicago Press, 2010
33 Lee A. M., Lewis S. C., Powers M. Audience Clicks and News Placement. A Study of Time-Lagged Influence in Online Journalism. Communication Research. 41(4). 2014. Pp. 505-530
34 Anderson, C. W. Between creative and quantified audiences: Web metrics and changing patterns of newswork in
local US newsrooms. Journalism. 12(5). 2011. Pp. 550-566
35
Shoemaker, P., Johnson, P., Seo, H., & Wang, X. (2010). Readers as gatekeepers of online news: Brazil, China, and the United States. Brazilian Journalism Research 6(1), Pp. 55-77
36 Деловая журналистика / Отв. ред. Вырковский А.В / А. В. Афанасьева, М. В. Блинова и др. — М: МедиаМир, 2012
Полезными источниками для воссоздания картины становления рынка
37
отечественной качественной прессы оказались исследования В. Кулева ,
"5 О -5Q
B.Л. Иваницкого и Д.А. Мурзина .
Отходя от советских структур, российская пресса «испытывает на себе влияние более раннего периода развития газетного рынка — разделения прессы на качественную, адресованную элите общества, и массовую, рассчитанную на невзыскательный вкус»40, - пишет Е.Л. Вартанова. При этом стабилизация рынка российских СМИ заставляет редакции более внимательно относиться к аудитории, ее запросам и меняющимся социодемографическим характеристикам. Таким образом, СМИ в новых реалиях должны не только «соответствовать требованиям политических или экономических элит, но и учитывать запросы аудитории», отмечает Е. Л. Вартанова.
Научная новизна исследования. Западные медиаисследователи с середины 2000-х гг. пытаются проанализировать эволюцию отношений редакций СМИ с аудиторией, происходящую благодаря внедрению систем веб-аналитики. При этом большинство упомянутых работ западных медиаисследователей основаны на качественной методике: в основном, это этнографические наблюдения за тем, как редакции по всему миру внедряют системы веб-аналитики в свою ежедневную работу.
Количественных исследований, анализирующих полученные с помощью систем веб-аналитики метрики, почти нет. Можно отметить только две таких работы. Одна из них - анализ, проведенный в исследовании А. Ли,
C. Льюис и М. Пауэрс 41, которые проанализировали материалы с сайтов трех газет, в числе которых веб-страница одного из самых авторитетных изданий
37 Кулев В. Деловая пресса России: автореф. дис. ... докт. филол. наук: 10.01.10. - M, 2000.
38 Иваницкий В. Л. Основные направления в проблематике российской прессы: экономика // Публикация в
рамках научно-исследовательского проекта РГНФ-АФ СМИ в меняющейся России, 2006.
39
Мурзин Д.А. Очерк типологии деловой прессы // Вестник Московского университета. Серия 10. Журналистика. 2003. № 2. C. 64 - 75
40 Средства массовой информации постсоветской России / Под редакцией Я.Н. Засурского - М.: Аспект Пресс, 2002
41 Lee A. M., Lewis S. C., Powers M. Audience Clicks and News Placement. A Study of Time-Lagged Influence in Online Journalism. Communication Research. 41(4). 2014. Pp. 505-530
в мире - «Нью-Йорк Таймс» (The New York Times), и, используя структурное моделирование, выяснили, что клики аудитории влияют на размещение статей на этих веб-сайтах. Исследователи пришли к выводу, что редакторы современных СМИ обращают внимание на то, какие материалы пользуются интересом у аудитории, держат их на более выгодных местах на странице и дольше оставляют на главной странице сайта. Второе количественное исследование провели голландские исследователи во главе с К. Уэлберсом. Они на протяжении шести месяцев анализировали печатные и онлайн-версии пяти крупнейших национальных газет Нидерландов и обнаружили, что «наиболее часто просматриваемые статьи с сайтов с большей вероятностью получали дальнейшее освещение» и чаще попадали на страницы бумажной
42
версии .
В России, насколько автор может судить, до сегодняшнего дня не было проведено ни одного исследования, целью которого было бы выявление роли инструментов веб-аналитики в изучении аудитории онлайн-СМИ. Научных исследований о предпочтениях аудитории, основанных на количественном анализе данных веб-аналитики и посвященных выявлению причин популярности отдельных материалов в онлайн-СМИ и факторов, влияющих на количество просмотров, в России также не публиковалось. Не изучались ни списки самых популярных материалов отдельных средств массовой информации, ни факторы, которые могли бы повлиять на читаемость материалов. Для отечественной науки такие исследования представляли бы большую ценность.
В своей работе автор изучает существующие практики применения данных систем веб-аналитики в онлайн-СМИ, и возможности их применения для определения факторов читательских предпочтений. Автор также предлагает первый в России количественный анализ данных веб-аналитики по материалам сайта РБК, ежемесячная аудитория которого в период
42
Welbers K., Van Atteveldt W., Kleinnijenhuis J., Ruigrok N., Schaper J. News selection criteria in the digital age: Professional norms versus online audience metrics. Journalism. 17 (8). 2015. Pp.1037-1053
проведения исследования превышала 20 миллионов человек. В работе анализируются данные о более чем тысяче самых популярных материалов с сайта РБК с 1 июля 2015 по 31 июня 2016 гг., чтобы показать, как веб-аналитика может использоваться для выявления факторов, влияющих на интерес к материалам.
В качестве рабочей гипотезы исследования выступает предположение о том, что производители и потребители контента (другими словами, редакции СМИ и их аудитория) по-разному оценивают качество журналистских материалов. Учитывая, что от размеров и качества аудитории сегодня зависит экономическая состоятельность СМИ, редакциям становится крайне важно понимать предпочтения своей аудитории. Основными инструментами достижения этой цели являются системы веб-аналитики, которые позволяют получить огромный объем данных о размере и демографических характеристиках аудитории, а также о ее поведении на сайте. Грамотный анализ этих данных позволяет приблизиться к пониманию предпочтений аудитории и, соответственно, повлиять на процесс производства и презентации контента. Собранные с помощью систем веб-аналитики данные можно использовать для выявления факторов, влияющих на популярность материалов в каждом конкретном онлайн-СМИ.
Объектом исследования в данной работе становятся данные веб-аналитики о предпочтениях аудитории сайта rbc.ru.
Предмет исследования - существующие практики использования данных веб-аналитики в работе редакции онлайн-СМИ и возможности их применения для определения факторов читательских предпочтений.
Цель исследования состоит в том, чтобы выделить в работе современных редакций процессы, подверженные непосредственному воздействию данных веб-аналитики о читательских предпочтениях, а также раскрыть возможности использования этих данных в определении факторов читательских предпочтений.
Для достижения поставленной цели автор решает следующие
исследовательские задачи:
• оценить имеющийся разрыв в восприятии качества журналистских материалов потребителями и производителями медиаконтента российских деловых СМИ;
• выявить масштаб и специфику использования данных веб-аналитики в одном из крупнейших российских онлайн-изданий - на сайте РБК;
• выявить факторы, которые способны повлиять на число просмотров статей, опубликованных на сайте РБК.
Эмпирическую базу исследования составили результаты трех этапов исследования, проведенного автором. На первом из них изучалось отношение редакций СМИ и их аудитории к качеству материалов с помощью анкетирования. Представителям СМИ и их аудитории предлагалось сначала оценить содержательные и структурные компоненты качества журналистского текста по десятибалльной шкале, а затем сравнить качество двух новостей и двух фичеров, посвященных одним и тем же событиям, но радикально отличающихся по соответствию стандартам деловой журналистики.
На втором этапе автор получил результаты посредством наблюдения за работой редакции одной из крупнейших онлайн-редакций в России. В течение года - с 1 июля 2015 по 31 июня 2016 гг. - автор следил за работой редакции РБК, выявляя принципы взаимодействия редакции медиахолдинга с данными систем веб-аналитики в условиях редакционного процесса.
На третьем этапе автор изучал факторы, которые могут влиять на популярность отдельных материалов, опубликованных на сайте РБК. Исследование опиралось на регрессионный анализ данных о более чем тысяче материалов с сайта РБК, которые за год с 1 июля 2015 г. по 31 июня 2016 гг. еженедельно набирали наибольшее количество просмотров. Каждая из статей анализировалась по ряду факторов, от количества слов в заголовке до тематики, тональности и даже общественной значимости.
В качестве ключевых методов работы были выбраны анкетирование и кейс-стади, в рамках которого непосредственно использовались наблюдение и регрессионный анализ вторичных данных. Выбранные методы позволили определить разницу в оценке материалов потребителями и производителями контента, исследовать влияние данных веб-аналитики на редакционные процессы РБК, а также описать основные факторы, влияющие на читательские предпочтения. Метод регрессионного анализа использовался как наиболее эффективный и надежный способ исследования влияния большого количества независимых факторов на зависимую переменную - в нашем случае, на количество просмотров отдельных материалов. Помимо этого, автор использовал традиционные для научного анализа методы, такие как наблюдение, измерение, анализ, синтез, сравнение, систематизация.
В процессе подготовки исследования использовались материалы научных конференций и семинаров, труды исследователей в области истории, практики и теории журналистики, отчеты органов статистики, интервью с практикующими журналистами, менеджерами СМИ, экспертами масс-медиа, работами теоретиков философии, социологии, статистики и других наук. Полученные результаты были представлены в диаграммах и таблицах.
Научно-практическая значимость данного исследования состоит, во-первых, в обобщении существующих наблюдений о том, как различные редакции средств массовой информации пытаются приблизиться к пониманию предпочтений собственной аудитории, как они используют для этого системы веб-аналитики. Во-вторых, данная работа впервые в России показывает принципы взаимодействия СМИ с данными веб-аналитики в условиях реального редакционного процесса. Наконец, автор также впервые в России исследует предпочтения аудитории, основываясь на количественном анализе данных систем веб-аналитики одного из крупнейших российских онлайн-СМИ, пытаясь выявить причины
Похожие диссертационные работы по специальности «Журналистика», 10.01.10 шифр ВАК
Вирусный контент в социальных сетях как инструмент вовлечения (структурно-функциональные, жанрово-тематические и стилистические закономерности создания и реализации)2022 год, кандидат наук Бабаева Айсулу Айсовна
Технологии работы ведущих российских телеканалов с эфирным контентом в интернете2020 год, кандидат наук Шацкая Александра Дмитриевна
Профессиональная журналистская культура в современной России2021 год, доктор наук Нигматуллина Камилла Ренатовна
Содержание и структура телевизионных сообщений как факторы их эффективности2002 год, кандидат филологических наук Мостепанова, Юлия Владимировна
Экономическое мышление в журналистике: парадигмальный переход2023 год, доктор наук Коноплев Дмитрий Эдуардович
Список литературы диссертационного исследования кандидат наук Шароян Сирануш Вардановна, 2019 год
Источник: ТЫБ
В 2014 году выручка холдинга РБК от медиабизнеса составила 3 млрд рублей, из которых почти две трети пришлись на доходы от интернет-рекламы. В 2015 г. медийный бизнес холдинга пытался сохранить объем выручки вопреки негативным рыночным тенденциям, и сотрудникам холдинга это удалось: рекламные продажи показали хоть и скромный, но прирост (+1%). Лучше остальных чувствовал себя интернет, который вырос на 5%, несмотря на общерыночное снижение объемов интернет-рекламы на 2%. Во многом такие результаты объяснялись умением редакции анализировать предпочтения своей аудитории. Понимая важность сохранения и увеличения аудитории, от размеров и качества которой зависят
доходы издания, редакция и менеджмент медиахолдинга уделяли немало внимания анализу показателей систем веб-аналитики.
Методика исследования влияния данных веб-аналитики на редакционную работу. Автор использовал метод кейс-стади для изучения применения данных систем веб-аналитики в условиях реального редакционного процесса. В течение года - с 1 июля 2015 года по 31 июня 2016 года в ситуации «участник как наблюдатель». Данный метод характеризуется включенностью наблюдателя в группу (автор одновременно исполнял роль корреспондента отдела финансов сайта РБК), однако всем участникам была ясна его роль как исследователя. Для более точного определения степени влияния данных о читательских предпочтениях на работу редакции автор также проводил свободные интервью c сотрудниками редакции, отделом маркетинга и менеджментом медиахолдинга. Данные методы позволили изучить опыт людей, напрямую связанных с предметом исследования, а также получить более глубокую информацию о латентных процессах.
Программа наблюдения предполагала регистрацию частоты проявления отдельных событий, таких как обсуждение популярности отдельных материалов или списков материалов, набравших больше всего просмотров, а также экспертный анализ наблюдаемой целостной ситуации, интуитивное обобщение и формирование оценок и выводов.
Выбор данного периода объясняется тем, что в середине 2014 года руководство холдинга приняло решение перейти с принципа print-first, когда традиционное издание (в случае с РБК - газета РБК и журнал РБК) являются основным продуктом, а сайт - дополнением к нему, к принципу web-first, когда стратегическим продуктом становится именно вебсайт144. В связи с этим медиахолдинг сосредоточил свои усилия на увеличении размера аудитории сайта, подключил три системы веб-аналитики, и к середине 2015
144 Ростова Н. Елизавета Осетинская: «Я понимаю, почему мы всех раздражаем» [электронный ресурс] // Republic. 2014, Дек. URL: https://republic.ru/posts/l/1170679 (дата обращения 20.02.2019).
года перестроил работу редакции таким образом, чтобы данные, полученные с помощью систем веб-аналитики, учитывались при принятии редакционных решений.
Данные о посещаемости сайта РБК в этот период собирались с помощью сразу нескольких систем веб-аналитики, таких как Гугл Аналитикс (Google Analytics), Яндекс.Метрика и Эйти Интернет (AT Internet). Руководство редакции РБК, департамент маркетинга и менеджеры медиахолдинга, в состав которого входит сайт РБК, в рассматриваемый период использовали в качестве основного источника информации счетчик Эйти Интернет, считая, что именно он давал наиболее полные и точные данные о поведение аудитории сайта. Данный инструмент, разработанный французскими программистами, на момент проведения исследования использовался владельцами более 20 тысяч вебсайтов и позволяет им измерять и анализировать, как посетители попадают на их веб-сайты, а также их поведение на самом сайте. Эта информация может быть визуализирована в информационных панелях и отчетах, которые затем могут быть разосланы по сотрудникам организации.
Результаты наблюдения за использованием данных о читательских предпочтениях в рамках редакционных процессов. Руководство холдинга и редакции (главный редактор, его заместители и редакторы отделов) каждое утро получали отчет о двадцати самых читаемых и пяти самых нечитаемых статьях за предыдущий день с указанием нескольких ключевых характеристик для каждой из них: количестве просмотров, среднем времени, которое читатели проводили за чтением, и источниках трафика. Доступ к этим отчетам по запросу могли получить и другие сотрудники редакции -например, журналисты, которым было интересно, как аудитория взаимодействовала с их материалами. Среди прочих данных, которые позволял получить счетчик Эйти Интернет, есть, например, информация о поведении читателей после прочтения материала - покинули они сайт или перешли по одной из гиперссылок на сайте, предлагающих ознакомиться с
другими материалами, об источниках трафика, количестве перепостов в социальных сетях. Счетчик позволял также отслеживать показатели просмотров каждого материала в реальном времени.
В период, когда автор проводил наблюдение, ежедневные утренние встречи редакции для обсуждения планов на день начинались с оглашения данных по трафику сайта за предыдущий день и читаемости отдельных статей. Озвученные данные всегда принимались в расчет при выборе новых тем для освещения. Например, видя интерес читателей к материалам, посвященным военному перевороту в Турции в июле 2016 г., редакция создала целый сюжет145, посвященный этой теме, где собираются новости, аналитические статьи, комментарии, фотогалереи - всего более ста материалов.
Изображение №1. Пример отчета, рассылавшегося сотрудникам РБК
09 ноября 2015
ПРОСМОТРЫ СТРАНИЦ
TAMhlF MHTAFMhlF MATFPI/1A/1 hl НА PfiK по ист ОЧНИК, МТРД ФИКД АВТОР
LnlVIDIL ЛК1 InLIVI DIL IVIrtl Lr/In/IDI ПЛ rDh ВСЕГО ПРЯМОЙ ™ VTOPW ПЛАТНЫЙ ДРУГИЕ
1 Forex-дилеры прекратят работу в России после Нового года 205 091 [■ГЖ] 1 2% [■И 21% 19« Юлия Титова
? Мелч^лм тлячал v)&->--> о скором во^чра ip-hw piv-лан в rrm<=»- 1%<М6 ■ 1 ■ 17% 11 4% Олига l a/VN<io
! И-юСМИ -юпыталлг->уада--> отчет Соте ли ч'лу ia? -<»па-га на пор-уАЛХ 1 1/1 1 II« и Андрей Кугне ;ов
1 SJ* i.IV 1 niii-. i > и» »л i ни<мс>«ним» <■:■! . ыьицм »«:-н iii м (Kipiy А4Л 1 ■ hV. с Л| > . м Фи.ы и-ж-к
э Л<.ок.-до1м ж1 J>K. чем тойсл Киемль 143 i'X» Ш 41 UK ■ l/% bl-' id 'Ик^ин. A idiiul«- h- Uflyjyc. 'Л^оль Ci« loM 01.Л.-J
6 Тцсмюк соэбии/i об юбеелг «ми о- российской геюзол зззлсимос-л Ш957 jj% ■ 1 19» II 6% 19% Ap-IM Ркли-еюк
7 "ЛаЧ-> ПраЧК-РЛ!*—ВПРан ГС Г><=4 ИЛЛ 1ГЮДЛЛ-->'-ан-(||ЛИ про-/к Роггли I V. r»l'. ^^E 34% 1 ■ II -1% Олига l a/VN<io
Н Л1 ЧОгЧ-lh X Л1рО-М»-г>ХНЛКУ Ч< ЛРИИ ОГнаруЖЛЛИ Яа Т^РГ.^ЛаМЛ l.i??IO И >-.%~l с Мач<-1«м('х>попоа
') ( 1 «кинем и «им 11 i Л к • им mi'iiMiii ii-iv I >Miliiiii>'«MNi <ы IIS'Mi. И 1 44»'. K.i .i ¡в И iiiii-M ii «
1Ü CVH ÜUUXJJ-rt-t О HUimriJdllU. И jHU.l'PU4 <M 'S 41I|X.H.(<J АЗЛ IIb WS ■ /</% | 1 1% I 4% l'J% üflWj l-ütab-SIO
11 Зз-!р^-ис .гит: ■■. ¡эчич убиг-гам -о-озл-хя 'ра*да1смибю1гсу 112 S04 ■ 7i% 1 OK 0 6% 20*. Сгоггй Соболгз
1? Гондон п^р^л ап Vor-Rf чкчод->1 раwi».-ки о арроятжм» теракта на борту АД?1 ЯЗ 116 J8% 1 ■ 17% I Марле Г®3aa
1Д V «лимитов <:о?роа-1ча аолнлклл проОлем-н ТГ»И ОГУШРГГППРНИИ плат?ж?л /«. <m I .% 1 с .oa-r/i шарорн
14 ■ и* «»ми >илл ||1иил<1|1и<м1. ищи Ii <и. ы;м.1.1 wli'^ оду /1 7 т. с '»% 1W М IjAtV 1 i-Л-М
15 КЛЛ01 > СО-tAl-HU i.'WIK Т/Л «.vi lllHltMU'MJ.WH ЮИ о ъиин иыикий П0Г) H ы% 1 ■ 1 1ВН I ь% Сла^ f»j. Ш-IK.'I- I t iJKUMH. M.'K.MJJ
10 Мосээсуд «ээсг-дз зэблоклэоээл RuTackc* org 71 914 H J!% 1 ■ tei I 3% : c% Алснз Сухээгэсчэя
1? "ofл«» чпре«!и<- Кад-апоа^м e?r<»pa-ioa КВН упроили в правител-и-гво 4f нл 71 lüft H 76% 1 1 (•% I "!% •w Гялаа<»-а Фог-
IH !> yia-ми Йог ■•литкой акал<»мил наук л.^ссм?» алрма Л19/0 с 12% D i% магго Ь^ррллна
14 VI.mimvm ><< Kail in <• < «N-i • кк etикк im irfipyiuMit. Imi«mh<i ы m 1У. 1 /% IS*. AhiuiiÜ К-, ш. - 4«>ц
¿0 ЮЯи-сМС J- М-ОД MKHKttM В (.СЛЛСЛЧс ' -- '-б.Рб-НЧ J ¿3J м> иJ liytl. Ы1 m С /¿% 1 (ЛС II lb% А» JJU Л Kyj voajj
21 Стоимость зреидь- сэмой л:л:эол чзар-лэ^ э Vockbc упала шж; 20 ri-c ру5 S9 412 OK 1 2% IBK Ольг: 1сди<то
?? эо«-скя чагенпетила i-вою roVre?-i-iorr-> кя рубмеом '»7 77Я 71% 1 0 4% 11 Г лгча Мгчина, Ана^аглг Мтаячовв, Степан Очалев
XI «Я в<-|»могу»' ч<=м »ЧЮ.ММИ1К-Я Vi 1 лл минл(-р пе«аги Млчалл <1?«-ин У. I ii [IL 11% mz I. ¡% 1 1 лляач<»-а Сурганова (<»п'?>л{одолев 1оялна-va<»aa
?4 11i < ИЛ yiH.i.i j о ■«•!«• |КК' и* m'Mitcii |лксн и ii-:i >ki iv» (и>|1> ЛлУТ SS /11 с 11% 0 1% /1П'. l-ял« 1-Я' 1 Ф<-ч-
¿5 'Hixiic öyj «-'о-иил». 4io и. Mtt тилнои IM <hiiui у Ки.-м/о- Ь2 Ь/Ь I^H d4% 1 ITA :% ьо^откия :кчюс11ь/фоп, оги/кж'я
26 Д^ср> здания КЗ >скоили »:слг>нычи ллстсми iogic подлог: Пээлсмско-о S1 J41 II Е 78К 0% 9% ьорспь оя .••обосто/фох,ого/кося
?7 | С\'И гооЧг.илл о i=np»T? готрулниктм V4C отдыха "к яа рубежом in V1<> ■ 63% 1 I 4% и -.% Ар'РМ ФИЛЛ1РМОК
УК Адвокат <-оол 1мл о пррдьачл^нии обвинений органила-олу у*>ий^ва I юва 4H4W ■= о i% Марлг 1 ?лаа Лма1~а<"ия М1ихал/юва
/"> :; и<и .¡иs.1'11ка|»<у>11 ii i'miy Ф(чу,.1 Ы'ик< 4/ ?iK> /% 44»'. Л| > . м Фи.1л и-ж-к
м U.MJ«- i^U-'fliw- oaiunj л1 ала-нов m^cixuj» J : им. 4SS/3 ■ 1 II У% i% :/% Hjtiv bcucjn j
51 Б СМОЛС1ККОЙ КОЛО ми пэсюсили бгепоррдкл СрСЛИ 32 упорен 42 535 ■ 17% ■ ; 72К 0% 12% ьорспь оя .••обосто/фох,ого/кося
г.? CVSi.,<=<= тло 1 яо? • -о глглл<v-,{ Россией ч году 42 410 1 4% 0% ■ . 76% 1 Ольга Маллнова
.'VI ( \*И упали ^ лопи /чпаллг в п^рмаате т»р<»-овороч о Kpyi. <»иил АЛЛ 411 t./i : V D (.% И1*. кароткоя т&тгть/фя.г. ivo ■vpi»-
S4 .l|tlk!Mi-')l Ki|- 1<К11ЛИ <1/|<Й||М|| |И'«'Я<МЛ1| (KlC/li-Oi'lHH !■■ Л- 111-И 4(11Ш ■ •t-.%~l I ■1% !/*. Анн кип 1 Млико>I
ЬЬ V ЛИ J ЛЬИ1 O0yjJA.OHM4 -s 1ЛЬЦИ Г, lk! О' ЛИ UCIJ J Ii t Ч J1 ^'РИ |!>УЦ MlbW ■ 4Л 1 I VA 1 ] i4% Мл)ил/1 М»и 1, A>lt.-K(.UMlljCiyiJ«l. VсK.LИМ ЛЛ\И |
Бсрсию тграк*а о 6оэ*у А 321 поовгрят з ла5орэторил H ül% 1 I УК 11 11% 25% Ар- г.м Филлюиок
г.? :;1едо№>~ив уянали обучодр >п М/.нОина кура-ора налоюаой '"и-— <»\ми '.fi Ml ■ 77% 1 7% 1 -1% tT*. Ар- ?м Фил л if кок
Л "пин" грани f га •-о ротглгн гмимаот г О.-ичпиады й IIH4 И ."лП l.iV Александр Арт<»м-»?а. 1 лляаа^-а Фог-
:-.'» Du I- 1- ki- «яр, 1К«1!К> И1 KUIblUH i lt'ilt-Й <Н MljMI ■. 1 - у/И' !«1! l'inii- (l'llHIKHiKJIXf 53 K/4 И Г /1*. Atli-H 1 Cv* 1!К"И 15-1«
Мутко рассказал об уничтожении допинг-проб с ведома WADA Я A T) ■ 1 ] I 4% '.SK Елизавета Фоет
*В "Другие источники" попадают просмотры страниц при переходах с одной новости на другую внутри сайта, вне зависимости от того, с какого источника пришел посвтитепь
Источник: данные системы Эйти Интенрнет
145 Военный переворот в Турции. Сюжет [электронный ресурс] // РБК. 2016 Июль, 16. URL: http://www.rbc.ru/photoreport/16/07/2016/578949059a79477f58be4f5772.shtml (дата обращения 23.12.2017).
Данные о просмотрах материалов также влияли на их расположение на сайте РБК. Анализируя «тепловую карту», показывающую в режиме реального времени, какие материалы читатели открывают чаще всего, заместитель главного редактора РБК Владимир Моторин, который среди прочего отвечал за расположение материалов на главной странице, сопоставлял области экрана с более высокой средней скоростью кликов и определял, находится ли нужный контент в нужном месте. Например, пятнадцать материалов с наивысшими показателями кликабельности (click-through rate, или CTR) оказывались в основном экране главной страницы сайта - в блоке, который в первую очередь видели посетители сайта. Основной экран главной страницы при этом должен был оставаться актуальным и меняться в течение дня, поэтому статьи оставались в главном блоке до тех пор, пока их CTR не падал ниже 6%. При падении CTR статьи ниже этого уровня, она заменялись либо более свежими материалами с высоким CTR, либо материалами с растущим CTR.
Изображение №2. Расположение наиболее кликабельных материалов на странице РБК
Источник: http://www.rbc.ru/
Чуть менее популярные материалы, или материалы, уже простоявшие достаточно долго в главном блоке, в зависимости от CTR, либо перемещались на второй экран, либо убирались с главной страницы во вкладки, посвященные конкретным рубрикам - политике, экономике, финансам и т.д. Популярность материалов при этом влияла не только на их расположение на сайте, но и на попадание в газетный номер. Сама газета, благодаря влиянию систем веб-аналитики на принятие редакционных решений, во многом стала напоминать витрину самых популярный материалов за день.
Приведем пример: материал, набравший больше всего просмотров 9 ноября 2015 г. (см. Изображение №1), оказался главным на передовице газеты РБК за 10 ноября. На главной странице так же даны ссылки на другие популярные материалы с сайта, касающиеся допингового скандала и исследования редакции о том, «Чем владеет Кремль» (см. Изображение №3).
Изображение 3. Расположение популярных материалов с сайта в газете
| ТЕМА ДНЯ 1 Допинговый скандал |
Почему Всемирное антидопинговое агентство предлагает снять россиян с 0лимпиады-2016 с. 10
«Инструкции из Минспорта»: в чем агентство обвиняет министерство и спецслужбы с. 10
Кому из тренеров и спортсменов угрожает пожизненная дисквалификация с. 10
РКК $ Александр Кириллов, владелец фермы «Лелечи»
rDrx -........—— ttkki. Повелитель кроликов СВОЙ БИЗНЕС, с. 18
ПОЛИТИКА ЭКОНОМИКА ЛЮДИ БИЗНЕС ДЕНЬГИ 10 ноября 2015 Вторник N0 206 (2223) WWW.RBC.RU
КУРСЫ ВАЛЮТ А <1* » €1= W ЦЕНА НЕФТИ ВИНТ (BLOOMBERG. А ИНДЕКС РТС (МОСКОВСКАЯ БИРЖА. W (ЦБ. 10.Ю.20151 РВ4.М А 1*9.61 Т 0910.201), 19.00 МСЮ $47,42 ЗА БАРРЕЛЬ 0910 20151 BS5.2C ПУНКТА МЕЖДУНАРОДНЫЕ РЕЗЕРВЫ РОССИИ (ЦБ. 3010-2013) ВМ9.2 МЛРД
ИССЛЕДОВАНИЕ
Чем владеет Кремль
ЕЛЕНА МЯЗИНА, АНАСТАСИЯ НАПАЛКОВА. МАРИЯ Ж0Л060ВА. СТЕПАН ОПАЛЕВ
Управделами президента, созданное в начале 1990-х годов для обеспечения нужд высокопоставленных чиновников, за свою более чем 20-летнюю историю обросло гигантскими территориями и огромным количеством собственности. Даже по скромной оценке самого ведомства, его земля и недвижимость стоят свыше S6 млрд.
Ведомство, созданное в 1993 газу первым кремлевским завхозом Пав -лом Бородиным,—не просто огромное хозяйство. Это целый «холдинг» из ста с лишним предприятий, среди клиентов которых не только высокопоставленные чиновники и парламентарии, но и частные заказчики. Набор предлагаемых УДП услуг многообразен: от бронирова -ния авиабилетов дообучения детей, пошива одежды и финансовых консультаций. В хозяйстве Управделами два агрокомплекса, шесть комбинатов питания, три автотранспортных предприятия, специальный летный отряд. 35 санаториев, домов отдыха и пансионатов, 13 больниц и поликлиник, 17 детских садов, пять строительных компаний, ателье,
Данные веб-аналитики влияли не только на расположение материалов на сайте, но и, в конечном итоге, на внешний вид самого сайта. В 2015 г., основываясь на результатах анализа взаимодействия читателей с сайтом, редакция РБК решила провести редизайн сайта. Описывая принципы, которыми руководствовалась редакция при создании нового сайта, директор по Ь2с-продуктам РБК Кирилл Титов объяснял, что каждое существенное изменение сначала проходит тестирование на малой доле аудитории и только при условии удовлетворения ряду критериев внедряется на 100% читателей. «Среди российских интернет-СМИ у РБК самая большая аудитория читателей, которая приходит на сайт напрямую, а не с помощью новостных агрегаторов, поисковых систем и прочего. Поэтому мы крайне бережно относимся к привычкам постоянных пользователей: каждое существенное изменение на rbc.ru сначала проходит тестирование», - отмечал он.
Главным изменением во время редизайна 2016 года стало внедрение «бесконечных страниц»: после прочтения статьи алгоритмы сайта автоматически подгружали пользователю другие новости из того же блока. Если читатель открывал материал об изменении курса доллара, сразу после ее прочтения ему открывалась статья на похожую тему - например, о валютных прогнозах на конец года. «Бесконечная лента стала очень популярной, потому что избавляла пользователя от необходимости постоянных переходов между страницами», - рассказывал Титов. Над разработкой и тестированием логики бесконечных страниц в РБК работали более полугода, на небольшом количестве читателей проверялись различные варианты реализации.
Версия, на которой в итоге остановилась редакция, тестировалась на 10% читателей сайта rbc.ru, и показала впечатляющие результаты: прирост глубины визита на 15%, снижение отказов на 6% и увеличение суммарного времени, которое читатели проводили на сайте почти на 10%.
Подробный анализ популярности материалов, выходящих на сайте РБК, позволял сегментировать аудиторию и контент, соотносить их,
сопоставлять, удовлетворять существующий спрос определенных сегментов, стремясь при этом обеспечить главную функцию по освещению обязательных событий. Расширяя штат, увеличивая объем охватываемых инфоповодов, руководство редакции старалось оценивать эффект от этих изменений по ряду очень конкретных показателей, таких как количество популярных материалов, доле новой аудитории, частоте возврата, глубине просмотра материалов и т.д.
Примером менеджерских решений, основанных на данных веб-аналитики, можно назвать создание СММ-отдела (SMM - Social Media Marketing), который позволил медиахолдингу увеличить долю трафика из социальных сетей и узнаваемость среди новых аудиторий. «С каждой страницы РБК в социальных сетях в обычный день на сайт переходили 60-80 тысяч человек пользователей. После того, как было принято решение, при публикации материалов в социальных сетях давать к ним обширное объяснение, на страницу РБК в социальной сети Facebook каждый день стали подписываться по 200-300 человек — при том, что до этого подписывались по 20-30 человек. Среди самых популярных в России деловых СМИ — на русском и английском языках - по показателю People Talking About страница РБК оказалась на втором месте после The Wall Street Journal, - объяснял руководитель отдела социальных сетей медиахолдинга Ислам Абдуллабеков.
В целом результаты наблюдения за редакцией одного из крупнейших онлайн-СМИ в России позволили подтвердить гипотезу о том, что редакции российских средств массовой информации - наравне с западными -переходят от интуитивного понимания своей аудитории к ее точному измерению и анализу ее предпочтений с помощью высокотехнологичных инструментов веб-аналитики. Данные о том, какие материалы вызывают у аудитории интерес, влияли как на редакционные решения (например, какие темы освещать, а какие - нет, какие материалы ставить на самые просматриваемые части вебсайта и т.д.), так и на стратегические решения
редакции РБК (запуск редизайна сайта и создание отдела по работе с соцсетями).
Благодаря анализу предпочтений аудитории и решению использовать собранные данные при принятии важных решений редакции РБК удавалось не только удерживать, но и увеличивать аудиторию даже в период, когда рынок падал. К началу 2017 года аудитория сайта составила 26,5 миллионов уникальных пользователей, увеличившись на 500 тысяч пользователей за год. Во многом это объясняется именно тем, что редакция научилась лучше понимать, зачем люди приходят на сайт. Однако предоставляемые системами веб-аналитики возможности по оптимизации редакционной деятельности гораздо шире, и работа по совершенствованию методов работы с медиатекстами может быть еще более комплексной и глубокой.
§2.3. Определение факторов читательских предпочтений с помощью инструментов веб-аналитики
Наблюдение автора за рабочим процессом в РБК показало, что веб-аналитика стала неотъемлемой частью жизни редакции. При этом главные вопросы, на которые она может дать ответ, - за счет чего отдельные материалы набирают сотни тысяч просмотров, какие факторы влияют на интерес аудитории к отдельным материалам - оставались для журналистов без ответа.
Совместно с журналистами редакции РБК автор выявил факторы, которые потенциально могли повлиять на популярность материалов - от тематики и длины заголовка до времени и дня публикации. Далее с помощью регрессионного анализа данных о самых популярных статьях, опубликованных на сайте РБК в период наблюдения - с 1 июля 2015 по 31 июня 2016 года, автор изучил влияние этих факторов на количество просмотров отдельных материалов. В результате анализа было выявлено несколько статистически значимых результатов, показывающих, как отдельные факторы могут повлиять на общее количество просмотров.
Методика исследования популярных материалов с сайта РБК. Исследование автора было основано на анализе данных о более чем тысяче материалов с сайта РБК (www.rbc.ru), которые за год с 1 июля 2015 года по 31 июня 2016 года еженедельно набирали наибольшее количество просмотров. Для составления выборки собирались данные о двадцати самых популярных статьях за каждую неделю выбранного периода (т.е. статьях, которые за неделю с момента публикации набирали наибольшее количество просмотров). Анализ именно популярных материалов, а не всех, публикуемых на сайте, позволил сместить выборку вверх и проанализировать, какие факторы влияют на просматриваемость именно статей, больше всего интересующих читателей.
Данные собирались с помощью системы веб-аналитики Эйти Интернет. Как автор указывал выше, именно показатели этого счетчика руководство редакции и холдинга в рассматриваемый период использовали как основной. Среди данных, которые позволял получить счетчик, была информация о количестве просмотров, источнике трафика, времени просмотров, данные о поведении читателей после прочтения анализируемой статьи - покинули они сайт или перешли по одной из гиперссылок, предлагающих ознакомиться с другими материалами, информация об источниках трафика, количестве перепостов и т.д. Помимо этих данных, автор на основе проанализированной научной литературы и критериев, которые используются в редакции РБК при попытках прогнозировать потенциальный интерес аудитории к статье, также выявил факторы, которые теоретически могли оказывать влияние на интерес аудитории к отдельным статьям.
Так, одним из наиболее значимых факторов, определяющих интерес к материалу, является его тематика. В первую очередь, она отражается рубрике, в которую попадает материал. На сайте РБК существовало 6 тематических рубрик: «политика», «экономика», «финансы», «технологии и медиа», «бизнес» и «свое дело».
Кроме того, тематика материала отражается в его заголовке, поэтому автор подробно анализировал заголовки выбранных статей. Для начала все заголовки были разделены на четыре типа, согласно делению, которое существует в редакции РБК. Первый тип заголовка - «новостной» - коротко и максимально подробно обозначает, какая информация содержится в статье. Это классический пример заголовка новости, построенной по принципу перевернутой пирамиды - все самое важное читатель узнает уже из первых строк, авторы статей с такими заголовками надеются, что читатель заинтересуется обозначенной проблемой и откроет материал, чтобы прочитать подробности. Приведем пример такого заголовка: «Сеть Kira Plastinina получила десятки исков на общую сумму в 45 млн руб»146.
Второй тип заголовка - «открытый». Его цель - заинтриговать читателя, поэтому автор пытается сохранить в таком заголовке интригу.
147
Например, «ЦБ отозвал лицензию у двух банков» . Большинству читателей, у которых есть депозиты в банках, скорее всего, будет интересно, не об их ли банке идет речь. Другой пример: «"Когалымавиа" назвала «единственную
148
разумную причину разрушения» А321» Что это за проблемы - из заголовка непонятно, но, теперь читатель знает, что она есть, и ему интересно, о чем пойдет речь в статье. Открытый заголовок - это почти всегда выбор автора, ведь для таких заметок можно было бы легко подобрать соответствующие новостные заголовки, которые звучали бы, например, так: «ЦБ отозвал лицензии у Эл Банка и Мострансбанка»; «"Когалымавиа" назвала внешнее воздействие единственной возможно причиной крушения А321».
Третий тип заголовка - «двухчастный». Он обычно используется в неновостных жанрах, материалах, где автор пытается проанализировать и
146 Левинская А. Сеть Kira Plastinina получила десятки исков на общую сумму в 45 млн руб. [электронный ресурс] // РБК. 2015. 22 июля. URL: http://www.rbc.ru/business/22/07/2015/55af9b1e9a79470b7922870d (дата обращения 23.12.2018)
147 Фохт Е. ЦБ отозвал лицензии у двух банков [электронный ресурс] // РБК. 2016. 05 мая. URL: http://www.rbc.ru/finances/05/05/2016/572ae14e9a79475fee178fbc (дата обращения 23.12.2018)
148 Лейва М, Темкин А. «Когалымавиа» назвала «единственную разумную причину разрушения» А321 [электронный ресурс] // РБК. 2015. 02 ноября. URL: http://www.rbc.ru/society/02/11/2015/563730199a7947cf10134658 (дата обращения 23.12.2018)
объяснить какие-то события, тренды и т.д. Первая часть в таком заголовке -более образная, метафоричная, вторая - более содержательная, дающая читателю понять, о чем пойдет речь в статье. Нередко такие заголовки используются в авторских колонках, и тогда первая часть может отражать отношение автора к тому, о чем он написал материал. Приведем несколько примеров таких заголовков: «За Сирию, за Асада: когда и зачем Москва решила воевать»149, «Удар на $44 млрд: во сколько может обойтись конфликт России и Турции»150; «Новая реальность: что ожидает россиян и бизнес после обвала рубля»151.
Наконец, четвертый тип заголовка - это «заголовок-цитата». Чаще всего используется для обозначения интервью, например, «Вагит Алекперов
152
— РБК: «У нефтяников сейчас не остается никаких денег» . Но бывают и исключения, когда таким заголовком обозначают, например, общее настроение или самое яркое высказывания из нескольких выступлений, например, «Мы не нуждаемся в лекциях»: как страны ЕС бунтуют против
153
правил союза» .
Заголовки выбранных материалов были также проанализированы по их тональности, чтобы можно было определить, есть ли какая-то зависимость от того, хорошая новость или плохая, и ее читаемостью. По этому принципу выделено три типа заголовка: негативные («Центральный банк отозвал лицензию у двух банков»154), нейтральные («Греф предсказал скорый отказ
149 Бочарова С., Рубин М., Макутина М., Гликин М. За Сирию, за Асада: когда и зачем Москва решила воевать [электронный ресурс] // РБК. 2015 Сент., 30. URL: http://www.rbc.ru/politics/30/09/2015/560bffdd9a794744eb92da3b (дата обращения 23.12.2018)
150 Ткачев И., Дзядко Т., Милюкова Я. Удар на $44 млрд: во сколько может обойтись конфликт России и Турции [электронный ресурс] // РБК. 2015. 24 ноября. URL: http://www.rbc.ru/economics/24/11/2015/565491679a794731607274ef (дата обращения 23.12.2018)
151 Ткачев И., Милюкова Я., Волкова О. Новая реальность: что ожидает россиян и бизнес после обвала рубля [электронный ресурс] // РБК. 2016. 20 января. URL: http://www.rbc.ru/economics/20/01/2016/569f8f9c9a79474677892137 (дата обращения 23.12.2018)
152 Осетинская Е. Вагит Алекперов — РБК: «У нефтяников сейчас не остается никаких денег» [электронный ресурс] // РБК. 2016. 20 января. URL: http://www.rbc.ru/interview/business/20/01/2016/569fa24f9a79475cf2473e51 (дата обращения 23.12.2018).
Мархулия Е. «Мы не нуждаемся в лекциях»: как страны ЕС бунтуют против правил союза [электронный ресурс] // РБК. 2016. 06 Июля. URL: http://www.rbc.ru/photoreport/06/07/2016/577bbf789a79475798cd46eb (дата обращения 23.12.2018).
154 См. выше
клиентов Сбербанка от пластиковых карт»155) и позитивные («Порошенко предложил объявить в Донбассе перемирие на Пасху»156).
Наконец, была проанализирована и зависимость читаемости статьи от длины заголовков и наличия в них слов-маркеров, привлекающих внимание читателей. Для того, чтобы выделить такие слова, автор проанализировал тексты заголовков и выявил наиболее часто встречающиеся слова. В рассматриваемый период для сайта РБК словами-маркерами оказались слова «Путин» (178 раз), «Сирия» (106 раз), «Украина» (94 раза), «Россия» (88 раз), «США» (69 раз). Автор также проанализировал вероятное влияние этих слов на популярность статьи среди читателей сайта РБК.
Еще один «тематический» фактор, влияние которого анализировал автор - это попадание материалов в тематические сюжеты, которые редакция РБК создавала, когда происходили какие-то крупные события, требующие долгого освещения с помощью большого количества материалов. К таким сюжетам в анализируемый период относились, например, «Война в Сирии», «Украинский кризис», «Валютный кризис» и т.д. Названия сюжетов отражаются в верхней части сайта РБК, и, открывая любой из них, читатель попадает на страницу со всеми материалами по интересующей его теме - от коротких новостей до развернутых аналитических статей и авторских колонок.
Анализировалась и общественная значимость материала с точки зрения
формирования общественной повестки. Автор использовал для этого
1
разделение на «жесткие» и «мягкие» новости (hard/soft news) . Первые обычно относятся к важнейшим для общественной жизни темам, таким как
155 Гордеев В. Греф предсказал скорый отказ клиентов Сбербанка от пластиковых карт [электронный ресурс] // РБК. 2016. 26 Мая. URL: http://www.rbc.ru/business/26/05/2016/57462ac79a79476fef31c2ef (дата обращения 23.12.2018)
156 Калюков Е. Порошенко предложил объявить в Донбассе перемирие на Пасху [электронный ресурс] // РБК. 2016. 29 апреля. URL: http://www.rbc.ru/rbcfreenews/58fb81a39a794750b3e0a64f (дата обращения
23.12.2018)
157
см., например, Newman N., Fletcher, R. Digital News Report 2016. Reuters Institute for the Study of Journalism. [электронный ресурс] // Reuters Institute. 2016. URL: http://www.digitalnewsreport.org/survey/2016/hard-soft-news-2016/ (дата обращения 20.06.2018)
политика, экономика, международные отношения и т.д. «Мягкие» новости в свою очередь менее значимы с общественной точки зрения, к ним относят, например, материалы о стиле жизни (lifestyle), развлечениях и т.д.
Кроме того, автор рассматривал в качестве одного из факторов «эксклюзивность» материалов. Речь идет об информации, имеющей общественную значимость, которую журналисту удалось добыть раньше всех. Читатель издания, в котором опубликован эксклюзив, оказывается в выигрышном положении относительно читателей других изданий: он получает возможность раньше других узнать важные новости. Это особенно важно в деловой журналистике, когда любая новость может повлиять на котировки акций, и человек, получивший информацию первым, может извлечь из нее значительную выгоду. Поэтому этот фактор эксклюзивности потенциально также может оказывать влияние на читаемость статей.
Еще один важный фактор, который может влиять на читаемость материала, - это его жанровая принадлежность. Под журналистскими жанрами подразумеваются «устойчивые типы публикаций, объединенных
158
сходными содержательно-формальными признаками» . При анализе выбранных статей автор взял за основу жанровое разделение, которое принято в РБК. В результате, среди анализируемых материалов оказались статьи девяти жанров:
• Новость - сообщение объемом 10-20 строк, построенное по принципу перевернутой пирамиды и содержащее ответы на шесть основных вопросов (кто? что? где? когда? почему? каким образом?). На сайте РБК новости выступают основными носителями оперативной информации, позволяющей аудитории осуществлять постоянный мониторинг наиболее значимых, интересных событий;
• Заметка - сообщение, содержащее, помимо описания сути события и ответов на основные вопросы, подробный рассказ о нем с деталями и бэкграундом - дополнительной информацией, напрямую не связанную
158 Тертычный А.А. Жанры периодической печати. Учебное пособие. — М.: Аспект Пресс, 2000
с событием, но помогающей лучше понять смысл произошедшего. Заметки также часто содержат комментарии, пояснения, позиции сторон;
• Фичер - жанр, наиболее характерный для журналов, но достаточно часто использующийся и при создании материалов для сайта РБК. Фичер относится к группе жаров рациональной публицистики, ставящих во главу угла не собственно информацию, а ее анализ, осмысление и интерпретацию фактов. Это история, написанная от третьего лица, но дающая возможность пережить случившееся159. Фичеры позволяют почувствовать глубину и подтекст истории, заставляют читателя задуматься и сопереживать160.
• Интервью - жанр, который представляет собой диалог репортера с одним человеком или несколькими, представляющими интерес для зрителей или читателей. Это могут быть очевидцы происшествий, общественные деятели, учёные.
• Расследование. Бывший заместитель главного редактора газеты «Newsday» Роберт Грин после знаменитого уотергейтского скандала назвал журналистским расследованием «материал, основанный, как правило, на собственной работе и инициативе, на важную тему, которую отдельные лица и организации хотели бы оставить в тайне»161. Для этого журналист-расследователь иногда использует приемы, взятые из практики правоохранительных органов.
• Репортаж - освещение события/мероприятия непосредственно с места событий. Задача любого репортера заключается прежде всего в том, чтобы дать аудитории возможность увидеть описываемое событие глазами очевидца (репортера), т.е. создать «эффект присутствия»162.
159 Колесниченко А.В. Практическая журналистика. Учебное пособие. - М.: Изд-во Моск. ун-та, 2008
160 Witt L. The complete book of feature writing. Writer's Digest Books, 1991
161 Уллмен Дж. Журналистские расследования: современные методы и техника. М., 1998.
162 Тертычный А.А. Жанры периодической печати. Учебное пособие. — М.: Аспект Пресс, 2000
• Онлайн-трансляция - относительно новый жанр интернет-журналистики. По сути текстовая трансляция - это видоизмененный репортаж, не случайно в качестве синонимов к термину онлайн-трансляция исследователи используют термины веб-репортаж или онлайн-репортаж. Однако в отличие от репортажа, который выходит единым материалом спустя какое-то время после того, как событие произошло, онлайн-трансляция «предполагает максимально документальную передачу и максимально жесткое совпадение вещания по времени с тем, что происходит»163. Это значит, что короткие сообщения об изменении ситуации появляются в ленте спустя всего несколько минут. Причем сбор информации происходит сразу по нескольким каналам (журналист на месте событий, сообщения в других СМИ и социальных сетях и т.д.)
• Фотогалерея - еще один относительно новый жанр интернет-журналистики, обладающий отдельными характеристиками репортажа. Фотогалереи представляют собой фотографии с места события, которое имело яркую визуальную составляющую, такого, что изображение с такого события расскажет читателям больше, чем словесное описание. Часто фотогалереи используются во время катастроф, чрезвычайных происшествий и т.д., например, «Катастрофа российского А321 в Египте» или «Взрывы в Брюсселе».
• Мнение - жанр, представляющий собой высказывание приглашенного эксперта на злободневную тему. Например, если речь идет об укреплении или ослаблении рубля, то экспертом может выступить крупный участник торгов на валютной бирже, если речь идет о разборе изменений в политической программе какой-то партии - высказаться попросят политолога и т.д. Комментарии в газетах, на радио и на телевидении существовали и раньше: оперативно сообщаемая новость
Как новые медиа изменили журналистику. 2012 - 2016 / А. А. Амзин, Д. Ю. Кульчицкая, Н. Лосева и др. — Гуманитарный университет Екатеринбург, 2016.
комментировалась, уточнялась, разъяснялась, но с начала 1990-х в ответ на экспансию «интенсивной журналистики» получили свое развитие жанры, прочно связанные с оперативным осмыслением факта, и комментарий из метода обработки факта превратился в жанр -мнение164. Важно при этом понимать, что любой материал, относящийся к жанру «мнение» - это впечатление, не претендующее на исчерпывающую полноту анализа, стержневой доминантой жанра выступает рассуждение, а подчеркнутая субъективность стиля, с одной стороны, как бы снижает претензии на справедливость оценок, а с другой - предлагает аудитории (соглашаясь или не соглашаясь с позицией публициста) самой сделать определенные выводы. Следующий фактор, который анализировался автором, всегда остается под пристальным вниманием руководства РБК - это источники трафика. Анализировались два основных источника, которые приносят сайту РБК большую часть просмотров - прямые заходы и заходы с новостных агрегаторов. При прямых заходах пользователи переходят на сайт из «закладок», сделав ее стартовой страницей или набрав прямой адрес сайта в адресной или поисковой строке. Такой тип поведения считается наиболее ценным и интерпретируется как относящийся к сверхлояльной аудитории, ядру медиаресурса165.
Второй источник - новостные агрегаторы, в основном Яндекс Новости и Новости Google. "Это золотая жила для современных цифровых медиа, откуда на веб-сайты приходит живой и релевантный ожиданиям трафик, способный при благополучном стечении обстоятельств удвоить суточную аудиторию даже такого крупного интернет-СМИ»166, - отмечает Лосева.
Анализировались также показатели лояльности пользователей: внутренние переходы и доскроллы.
164 Кройчик Л.Е. Система журналистских жанров // Основы творческой деятельности журналиста. Ред.-сост. С.Г. Корконосенко. - СПб.: Знание, СПбИВЭСЭП, 2000
165 Как новые медиа изменили журналистику. 2012 - 2016 / А. А. Амзин, Д. Ю. Кульчицкая, Н. Лосева и др. — Гуманитарный университет Екатеринбург, 2016. — 304 с.
166 Там же
Внутренние переходы отражают долю посетителей сайта, которые не покидают его, прочитав один материал (показатель отказов), а переходят на другие статьи по расположенным на странице ссылкам. Если средний показатель внутренних переходов с материал высок, значит, он заинтересовал читателя, и тот нашел рядом ссылки на другие статьи, которые показались ему интересными, он увидел очевидные пути перехода на другие материалы по этой теме или анонс других публикаций. Высокие показатели внутренних переходов говорят о том, что сайт содержит интересный качественный контент, и аудитория проводит на нем много времени, просматривая достаточное количество страниц. Напротив, высокий показатель отказов говорит о том, что люди не видят на сайте ничего интересного (например 75% отказов значит, что 75% людей, которые пришли на сайт, уходят на него, просмотрев единственную страницу, на которую вошли).
В свою очередь для определения уровня доскроллов, мы вычисляли время, которое бы потребовалось на прочтение статьи среднестатистическому читателю. Для этого мы делили количество слов в каждом материале на среднее количество слов, которое человек может прочесть за минуту (120), получив предполагаемое время чтения. Наконец, для определения вовлеченности читателей среднее время чтения, которое все читатели, открывшие статью, провели за ее просмотром, делилось на предполагаемое время чтения. Чем выше показатель, тем интереснее материал.
Автор также попытался найти зависимость количества просмотров материалов от дня недели, в который они были опубликованы и времени публикации.
Для анализа влияния различных факторов на читаемость статьи было решено провести регрессионный анализ.
Регрессионный анализ - это статистический метод исследования влияния одной или нескольких независимых переменных на зависимую
переменную. В нашем случае в качестве зависимой переменной были выбраны просмотры статей, в качестве независимых - указанные выше факторы: рубрика, тип заголовка и его тональность, количество слов в заголовке и наличие в нем слов маркеров, попадание материала в крупные тематические сюжеты, общественная значимость, эксклюзивность и жанровая принадлежность.
Регрессионный анализ позволяет осуществить сразу несколько операций:
• определить степень детерминированности вариации зависимой переменной независимыми;
• предсказать значения зависимой переменной с помощью независимых;
• оценить вклад отдельных независимых переменных в вариацию зависимой.
Используя данный метод и удалив 10% аномальных наблюдений, чтобы избавиться от проблемы аномальных наблюдений, удалось получить много интересных и статистически значимых результатов. Была предложена модель с константой:
Noread = fi^Words + topic + $3*Reposts + (34*5o/t + fi5*Exclusive
+ ^ Pi*Key Wordsi + ^ Pi *Gj + ^ Pj*Gi
+ ^ Pi*MDi + ^ Pi*tfi + ^ CV + Const
Где:
Words - количество слов в заголовке
Big topic - индикатор того, что тема попала в большой
сюжет
• Reposts - количество репостов статьи в соц. сетях
• Key words - наличие ключевых слов в заголовке (Путин, Сирия, Россия, Украина, США)
• Soft - общественная значимость
• О - жанр статьи
• МО - тон заголовка:
• Я - рубрика:
• СУ - включает ряд стандартных для подобных исследований контрольных переменных, для исключения проблемы эндогенности:
о месяц публикации статьи (т1-12); о день публикации статьи ^1-7);
о время публикации статьи, 12 двух-часовых интервалов (^-12);
о предположительное время чтения статьи (еБ^геаё); о показатель внутренних переходов (ей_^е) о количество прочтений, от пользователей пришедших через прямой трафик (ёгсМзаТ)
о количество прочтений, от пользователей пришедших по ссылкам с новостных аггрегаторов (indгct_tгaff) В данной модели выполняются все необходимые условия для выполнения регрессии:
1. Топ статей определяется случайным образом, исключительно исходя из предпочтений читателей сайта РБК;
2. Были учтены все возможные измеряемые количественные факторы, которые могли повлиять на читаемость материалов;
3. Входящие в модель переменные независимы друг от друга;
4. Условие нулевого математического ожидания ошибок выполняется автоматически, так как модель имеет константу.
В заключение стоит отметить, что из-за включения в выборку только статей, попавших в список самых читаемых, некорректно обобщать оценки, полученные в данной работе, без поправки на смещение. С высокой долей вероятности полученные в данной работе оценки смещены вверх, из чего можно сделать вывод о более низком влиянии исследуемых факторов на
читаемость статей. Чтобы определить смещение, необходимы дополнительные данные, достать которые на данном этапе не представлялось возможным. Однако полученные оценки хорошо отражают влияние факторов на читаемость популярных статей и являются состоятельными, несмещёнными и лучшими оценками в классе линейных.
Результаты анализа самых популярных материалов сайта РБК. В анализируемую выборку попало свыше тысячи статей. Из них больше половины - 53% - относились к рубрике «политика», еще 14% - к рубрике «общество», по 10% - к «бизнесу» и «финансам», 9% - к «экономике». Меньше всего популярных статей оказалось в рубрике «технологии и медиа» - всего 4%, причем среднее количество прочтений материалов этой рубрики также оказалось минимальным - 346 тысяч просмотров (против 385 тысяч просмотров в среднем по выборке).
Таблица 7. Распределение выборки по рубрикам
Рубрика Количество материалов, шт. Среднее количество просмотров, тыс. просмотров
Политика 547 418
Общество 143 395
Бизнес 109 374
Финансы 108 401
Экономика 92 380
Технологии и медиа 22 346
Источник: результаты исследования, расчеты автора
Стоит также отметить, что среднее число просмотров статей из различных рубрик различается несущественно. Наглядно распределение
выборки по рубрикам и просматриваемость материалов различных рубрик можно увидеть в Диаграмме 5.
Диаграмма 5. Распределение выборки по рубрикам
1000 500
Политика Общество Бизнес Финансы Экономика Технологии и
медиа
Количество материалов, шт. Среднее количество просмотров, тыс. просмотров
Источник: результаты исследования, расчеты автора
Среднее количество слов в заголовке анализируемых материалов составило 8,5 слов. Среди них оказалось 53% материалов с «новостными» заголовками, 32% материалов с «открытыми» заголовками, 11% материалов с «двухчастными» заголовками и только в 4% статей использовались «заголовки-цитаты». При этом большинство статей имеют или негативный (51%), или нейтральный (40%) заголовок, на материалы, которые имеют позитивные заголовки приходится только 9% анализируемых статей.
Таблица 8. Распределение статей по типу заголовков
Тип заголовка Количество материалов, шт. Среднее количество просмотров, тыс. просмотров
Новостной 557 395
Открытый 331 411
Двухчастный 119 416
Заголовок-цитата
14
429
Источник: результаты исследования, расчеты автора
Стоит отметить, что при этом среднее число прочтений материалов с самым популярным типом заголовка - новостным - оказалось минимальным (395 тысяч). В свою очередь не так широко представленные в выборке материалы с двухчастными заголовками и заголовками-цитатами интригуют читателя гораздо больше.
Диаграмма 6. Распределение выборки по типу заголовков
1000
100
10
III.
440 430 420 410 400 390 380 370
Новостной Открытый Двухчастный За го л о во к-цитата
Количество материалов, шт.
Среднее количество просмотров, тыс. просмотров
Источник: результаты исследования, расчеты автора
В выборку попали материалы девяти жанров, причем подавляющее большинство - 67% - относилось к жанру «новости». Также в выборке много заметок (24%). Это неудивительно, учитывая, что именно эти жанры являются базовыми для сайта РБК и требуют меньше всего времени на создание. Остальные жанры либо требуют долгой работы для написания материала (например, расследования или фичер), либо используются только, когда происходят какие-то выходящие из ряда вон события (например, онлайн-трансляции и фоторепортажи), поэтому их в выборке меньше.
Таблица 9. Распределение выборки по жанрам
Жанр
Количество
Среднее количество
материалов, шт. просмотров, тыс. просмотров
Новость 686 397
Заметка 260 404
Расследование 14 380
Фотогалерея 13 549
Фичер 13 347
Мнение 12 407
Интервью 11 403
Репортаж 6 422
Онлайн-трансляция 6 368
Источник: результаты исследования, расчеты автора
Снова можно отметить, что связи между количеством материалов определенных жанров и средним количеством их просмотров нет. Наиболее просматриваемыми являются материалы в жанре фотогалереи (549 тысяч просмотров) и репортажа (422 тысячи просмотров). Это, вероятно, связано с тем, что материалы этих жанров чаще всего используют в чрезвычайных ситуациях (например, фотогалерея «Военный переворот в Турции»167 или репортаж «Дальнобойщики призвали к отставке Путина на митинге в Москве»168).
Меньше всего просмотров при этом набирают фичеры (347 тысяч просмотров). Большинство материалов этого жанра, попавших в выборку, рассказывают о том, как владельцы крупных состояний их зарабатывали или сохраняли в сложных обстоятельствах (приведем в качетве примера типичного фичера материал «Короли кризиса: почему бизнес семьи Гуцериевых растет во время депрессии»169).
167 Военный переворот в Турции. Сюжет [электронный ресурс] // РБК. 2016 Июль, 16. URL: http://www.rbc.rU/photoreport/16/07/2016/578949059a79477f58be4f57/2.shtml (дата обращения 23. 12.2018)
168 Антонова Е. Дальнобойщики призвали к отставке Путина на митинге в Москве [электронный ресурс] // РБК. 2016 Апр., 03. URL: http://www.rbc.ru/politics/03/04/2016/570107c29a79471e68c8287a (дата обращения 23.12.2018)
169 Тофанюк Е., Полякова Ю., Пастушин А. Короли кризиса: почему бизнес семьи Гуцериевых растет во время депрессии» [электронный ресурс] // РБК. 2015. 3 ноября. URL:
http://www.rbc.ru/finances/23/11/2015/564f09ab9a79477b9606f66a (дата обращения 23.12.2018)
Диаграмма 7. Распределение выборки по жанрам
1000 100 10
гТГТг. I■!
х4- ¡¡¡г
-то
<зч «г*
У
Л"
600 500 400 300 200 100 О
I Количество материалов, шт.
■Среднее количество просмотров, тыс. просмотров
Источник: результаты исследования, расчеты автора
Анализ выбранных статей также показал, что материалы на сайте РБК публикуются достаточно равномерно в течение рабочего дня. Большая часть материалов, получивших наибольшее количество просмотров, было опубликовано в промежуток с 10 утра до 18 часов вечера (54%), меньше всего с полуночи до 8 утра (6,7%). Публикации по рабочим дням также довольно равномерно распределены. При этом в выходные вышло только 10% материалов, которые попали в выборку.
Таблица 10. Распределение выборки по времени публикации
Время публикации Количество материалов, шт. Среднее количество просмотров, тысяча просмотров
12:00 - 14:00 167 416
14:00 - 16:00 149 407
16:00 - 18:00 119 405
10:00 - 12:00 117 402
22:00 - 00:00 88 394
20:00 - 22:00 83 434
18:00 - 20:00 74 402
8:00 - 10:00 71 354
0:00 - 02:00 60 407
06:00 - 08:00 35 381
02:00 - 04:00 32 407
04:00 - 06:00 26 376
Источник: результаты исследования, расчеты автора
Явной связи между временем публикации и средним количеством просмотров при этом не наблюдается.
Диаграмма 8. Распределение выборки по времени публикации
180 500
12:00- 14:00- 16:00- 10:00- 22:00- 20:00- 18:00- 8:00- 0:00- 06:00- 02:00- 04:0014:00 16:00 18:00 12:00 00:00 22:00 20:00 10:00 02:00 08:00 04:00 06:00
Количество материалов, шт. Среднее количество просмотров, тысяча просмотров
Источник: результаты исследования, расчеты автора
Средний показатель доскролла анализируемых материалов составил 84%, то есть в среднем читатели покидали страницу с материалом из анализируемой выборки, прочитав 84% текста. Автор также проанализировал средний показатель доскролла материалов разных жанров. Напомним, чтобы
рассчитать этот показатель, вычислялось время, которое бы потребовалось на прочтение статьи среднестатистическому читателю. Затем среднее время, которое все читатели, открывшие статью, провели за ее просмотром, делилось на полученное значение. В результате автор получал выраженный в процентах показатель, который фактически показывает, как долго (относительно предполагаемого времени чтения) люди открывшие материал, его просматривали.
Как показал анализ, выше всего показатель доскролла был у материалов, относящихся к жанру фотогалереи (165% - значит на просмотр материала читатели тратили в полтора раза больше времени, чем требовалось для полного прочтения статьи) и новости, наименьшая - у расследований и онлайн-трансляций.
Таблица 11. Средний показатель доскроллов материалов разных жанров
Жанр Средний показатель доскроллов, %
Фотогалерея 165
Новость 101
Мнение 54
Репортаж 49
Заметка 47
Фичер 38
Интервью 22
Расследование 11,5
Онлайн-трансляция 11
Источник: результаты исследования, расчеты автора
Вероятно, такой разброс значений доскроллов у разных жанров отражает связь между доскроллами и жанром во многом обусловлен тем, что есть большая разница в среднем количестве слов, который характерен для тех или иных жанров. Например, среднее количество слов в новостях из анализируемой выборки составляет 238 слов, у расследований - 2576. То есть для того, чтобы прочитать новость среднего размера читателю понадобится 2 минуты, расследование - 20 минут.
Диаграмма 9. Показатель доскроллов и количество слов
Источник: результаты исследования, расчеты автора
Автор также проанализировал средний показатель доскроллов материалов, относящихся к разным рубрикам.
Диаграмма 10. Показатель доскроллов и рубрика
Источник: результаты исследования, расчеты автора
Как показал анализ, наибольший показатель доскроллов в таком разрезе у материалов, относящихся к рубрике «политика» (87%) и «общество» (115%), у них же - наименьшее среднее количество слов. При этом наименьшая глубина просмотров наблюдается у материалов рубрики «Технологии и медиа» (50%), то есть читатели обычно дочитывают только половину статей, относящихся к этой рубрике. При этом именно к этой рубрике относятся материалы с наибольшим средним количеством слов (854 слова).
Средний процент внутренних переходов с материалов, попавших в выборку, составляет 63% (то есть только 37% людей, которые просмотрели материал из выборки, после этого уходят с сайта РБК, остальные -продолжают чтение, перейдя по одной из предложенных ссылок). Для статей, попавших в выборку, средний показатель прямых переходов составляет 12%, переходов из новостных агрегаторов - 20%. При этом больше всего прямых переходов приходится на материалы, относящиеся к рубрикам «экономика», «финансы» и «технологии и медиа». В то же время самая большая доля переходов с новостных агрегаторов приходится на статьи, относящиеся к рубрикам «политика», «общество» и «бизнес».
Таблица 12. Переходы на материалы разных рубрик
Рубрика Прямые переходы, % Переходы с новостных агрегаторов,%
Политика 14 18
Общество 15 17
Бизнес 16 16
Экономика 19 10
Финансы 20 10
Технологии и
медиа 19 8
Источник: результаты исследования, расчеты автора
Только 14% попавших в выборку статей оказались эксклюзивными, при этом 70% материалов - общественно значимые.
Делая промежуточный вывод о том, какие материалы оказываются самыми читаемыми на сайте РБК, можно отметить, что, несмотря на «деловой» характер издания, большая часть популярных материалов с сайта относится к рубрикам «политика» и «общество», а среднее количество просмотров у статей больше всего в рубриках «политика» и «финансы». Меньше всего популярных статей оказалось в рубрике «технологии и медиа», причем среднее количество прочтений материалов этой рубрики также оказалось минимальным.
Самым часто встречающимися типом заголовка среди материалов, попавших в выборку, оказался новостной, при этом тональность большинства статей имеет или негативный, или нейтральный оттенок. Стоит отметить, что при этом среднее число прочтений материалов с самым популярным типом заголовка - новостным - оказалось минимальным.
Большая часть материалов, попавших в число самых популярных, относятся к жанру новости или заметки, что неудивительно, учитывая, что именно эти жанры являются базовыми для сайта РБК и требуют меньше
всего времени на создание. При этом связи между количеством материалов определенных жанров в выборке и их средним количеством просмотров нет. Наиболее просматриваемыми являются материалы в жанре фотогалереи и репортажа. Меньше всего просмотров набирают фичеры.
Анализ выбранных статей также показал, что материалы на сайте РБК публикуются достаточно равномерно в течение рабочего дня и рабочей недели. Меньше всего статей публикуется с полуночи до 8 утра, а также в выходные дни.
Средний показатель доскроллов анализируемых материалов составил 84%. Выше всего он был у материалов, относящихся к жанру фотогалереи и новости, наименьшим - у расследований и онлайн-трансляций. Вероятно, это связано с тем, что есть большая разница в среднем количестве слов, который характерен для тех или иных жанров. Средний процент внутренних переходов с материалов, попавших в выборку, составляет 63%.
Выявление факторов, влияющих на популярность статей на сайте РБК. Веб-аналитика используется в первую очередь для того, чтобы анализировать существующие в поведении аудитории веб-сайтов паттерны, выявлять тренды. Созданная автором модель регрессионного анализа помогает определить несколько таких паттернов, выявляя факторы, которые влияют на читаемость статей на одном из крупнейших онлайн-СМИ России -сайте РБК. Напомним, регрессионный анализ позволяет исследовать влияние одной или нескольких независимых переменных (а нашем случае выделенных факторов: рубрики, типа заголовка и т.д.) на зависимую переменную (количество просмотров). В своих выводах автор фокусируется только на тех факторах, которые оказались значимыми, по итогам используемой модели. (иначе говоря, выводы ниже верны в 90-99% случаев). Остальные факторы, получились статистически незначимыми, то есть полученной оценке можно доверять менее чем в 90% случаев. Однако это не означает, что они не влияют на количество прочтений. При получении более полных данных (например, данных по всем статьям РБК, а не только по
попавшим в список самых читаемых), эти факторы также могут стать значимыми.
Как показал регрессионный анализ, попадание в отдельные рубрики, а именно в рубрики «экономика» и «бизнес», при прочих равных увеличивает количество просмотров материала на сайте РБК. Так, если материал относится к рубрике «бизнес», его прочитают на 6,1% больше раз и количество просмотров в среднем вырастет на 23,6 тысячи. Попадание в рубрику экономика, соответственно, увеличивает количество просмотров почти на 5%, или на 18,7 тысяч просмотров. Согласно модели, эти наблюдения верны в 99% случаев. Попадание в остальные рубрики -политика, общество, технологии и медиа, бизнес и свое дело - не дает статистически значимых результатов.
Таблица 13. Влияние фактора «рубрика» на количество просмотров
Значение Влияние, просмотры Значимость, %
Экономика 18 657 99
Бизнес 23 637 99
Политика 31 955 не значимо
Общество 25 942 не значимо
Финансы 10 586 не значимо
Технологии и медиа 23 637 не значимо
Источник: результаты исследования, расчеты автора
При этом, как показал анализ, попадание материалов в крупные тематические сюжеты на популярность материала на сайте РБК не влияет. Влияние общественной значимости на просматриваемость материалов минимальна: анализ показывает, что при прочих равных статьи, которые относятся к незначимым, просматривают на 0,3% (или 1055 просмотров) меньше.
Таблица 14. Влияние попадания в сюжеты на количество просмотров
Фактор Значение Влияние, просмотры Значимость, %
Попадание в сюжет Есть в сюжете -3 404 не значимо
Общественная значимость Незначимый («мягкий») материал -1 055 99%
Источник: результаты исследования, расчеты автора
Как показал регрессионный анализ, тип заголовка не оказывает значимого влияния на показатель просмотров. Ни один из анализируемых типов при прочих равных не способен ни увеличить, ни уменьшить количество просмотров. То есть, выбирая, например, между «новостным» и «открытым» заголовком, которые, как автор отмечал выше, в большинстве случаев взаимозаменяемы, журналист может полагаться исключительно на свой вкус.
Таблица 15. Влияние типа заголовка на количество просмотров
Значение Влияние Значимость
Новостной заголовок -52 778 не значимо
Открытый заголовок -62 038 не значимо
Двухчастный заголовок -75 490 не значимо
Заголовок-цитата 75 490 не значимо
Источник: результаты исследования, расчеты автора
Незначимым оказался и фактор «тональности» заголовка. Согласно модели, статистически значимое влияние оказывает только позитивный тон, но и оно оказывается почти неощутимым - всего 0,16% (631 просмотр).
Такое низкое влияние на читаемость, подтверждает, что люди больше ориентируются на контент, чем на тональность заголовка.
Стоит отметить, что каждое новое слово в заголовке незначительно уменьшает количество просмотров. По прогнозам модели, добавление каждого нового слова к заголовку статьи на сайте РБК уменьшает количество просмотров на 0,2% (или на ~900 прочтений). Это значит, что журналистам стоит пытаться делать заголовки как можно более лаконичными.
Как показал анализ, наличие слов-маркеров в заголовке влияет на количество просмотров. В указанный период на сайте РБК использование слова «Путин» в заголовке увеличивало количество прочтений на 3% (или 11,4 тысяч прочтений). Этот вывод верен в 90% случаев. При этом использование слова «Украина» незначительно (~1%, или 3 тысячи прочтений) уменьшало количество просмотров статьи при прочих равных факторах. Данный вывод является верным в 99% случаев.
Таблица 16. Влияние тональности заголовка и количества слов в заголовке на количество просмотров
Фактор Значение Влияние Значимость
Тональность заголовка Позитивная -631 99%
Нейтральная -621 не значимо
Негативная -630 не значимо
Количество слов в заголовке Каждое новое слово -869 99%
Источник: результаты исследования, расчеты автора
Такие результаты, вероятно, можно объяснить тем, что люди не хотели пропустить новости о событиях, связанных с президентом страны Владимиром Путиным, так как на подсознательном уровне воспринимают их как важные, и автоматически открывают их, когда видят фамилию президента в заголовке. В то же время, тематика Украины значительно утомила читателя, и некоторые новости по этой теме могли намерено
пропускаться. Остальные выделенные автором слова-маркеры - «Россия», «США» и «Сирия» не оказывали статистически значимого эффекта на количество просмотров.
Таблица 17. Влияние слов-маркеров в заголовке на количество просмотров
Фактор Значение Влияние Значимость
Путин 11 448 90%
Украина -3 136 99%
Слова-маркеры Сирия 25 не значимо
Россия -4 779 не значимо
США 7 881 не значимо
Источник: результаты исследования, расчеты автора
Жанровая принадлежность статьи практически во всех случаях не оказывает значимого влияния на количество просмотров при прочих равных факторах. Однако есть одно исключение: как показал регрессионный анализ, жанр «мнение» значительно увеличивает читаемость статьи. Модель показывает, что при прочих равных, их прочитает на 25% больше читателей (+ 96,6 тысяч просмотров), чем другие материалы на сайте. Эта находка ещё раз подтверждает устоявшееся мнение, что сегодня аудитория онлайн-СМИ отдает предпочтение не «журналистике факта», а «журналистике мнений». Стоит отметить, что вывод о статистически значимом влиянии жанра «мнение» на читаемость статьи верен в 99% случаев.
Таблица 18. Влияние жанровой принадлежности на количество просмотров
Фактор Значение Влияние Значимость
Жанр Новость 4 599 не значимо
Заметка 17 150 не значимо
Фичер 13 672 не значимо
Расследование -25 499 не значимо
Интервью -11 880 не значимо
Репортаж -16 757 не значимо
Онлайн-трансляция 88 735 не значимо
Фотогалерея 33 744 не значимо
Мнение 96 634 99%
Источник: результаты исследования, расчеты автора
Ниже приведем диаграмму, показывающую все факторы, которые оказывают влияние на читаемость статей при прочих равных на сайте РБК.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.