Languages

You are here

Специфика источников информации в журналистике данных

Научные исследования: 

 

Ссылка для цитирования: Шилина А.Г. Специфика источников информации в журналистике данных // Медиаскоп. 2019. Вып. 2. Режим доступа: http://www.mediascope.ru/2550
DOI: 10.30547/mediascope.2.2019.9

 

© Шилина Александра Геннадьевна

соискатель кафедры теории и экономики СМИ факультета журналистики МГУ имени М.В. Ломоносова, аналитик венчурного фонда активного участия в криптосетях Paradigm Fund (г. Москва, Россия), alexandrashilina@mail.ru

 

Аннотация

В статье представлены основные результаты исследования источников информации в публикациях журналистики данных. Мы видим, что изменения, связанные с появлением феномена больших данных в середине 2010-х гг., обусловливающие новые способы поиска, обработки, анализа и представления информации, не полностью находят отражение в публикациях журналистики данных, влияние их использования на источники информации ведущих медиаорганизаций мира в 2014−2016 гг. остается минимальным. Результаты исследования позволяют провести разграничение между «журналистикой данных» в ее широком понимании, охватывающем целый спектр материалов, публикуемых в соответствующих рубриках, и условной «журналистикой больших данных» – как специализированном направлением в журналистике, материалы которого создаются с использованием информации, полученной из соответствующих по масштабам и сложности обработки цифровых баз данных.

Ключевые слова: датификация, большие данные, количественные данные, журналистика данных.

 

В XXI в. одной из ключевых тенденций в журналистике становится датификация – процесс представления явлений в количественном цифровом формате, преобразование данных в цифровую информацию, доступную для аналитики (Mayer-Schönberger, Cukier, 2013). Благодаря распространению датификации в практике СМИ последнего десятилетия формируется ряд тенденций по использованию данных: влияние новых технологий на процесс создания и тематику журналистского материала; возникновение новых возможностей доставки информации, творчества и самовыражения1.

Появляется технологический тренд и концепция больших данных2 (big data), которые представляют собой серию подходов, инструментов и методов обработки структурированных и неструктурированных машиночитаемых данных объёмом от одного петабайта3 для получения воспринимаемых человеком результатов (Manyika, Chui, BrownBughin et al., 2011: 1). Система больших данных включает технологии их анализа и использования, методы поиска необходимой информации в больших массивах и является сегодня одной из наиболее быстро развивающихся – ее объем удваивается каждые полтора года (Kelly, 2015).Около 90% больших данных оформляется в последнее десятилетие, и к 2020 г. по прогнозам специалистов их объем увеличится с 3,2 до 40 зеттабайт (Marr, 2016).

Концепция больших данных привлекает все большее внимание профессионалов во всех сферах: экономике, политике, социуме, культуре (Mayer-Schönberger, Cukier, 2013). В частности, для информационно-технологической инфраструктуры и массмедиа большие данные, согласно исследованию компании Gartner4, являются вторым по перспективности направлением развития после виртуальной реальности5.

В 2010-х гг., благодаря активному внедрению больших данных и использованию этих цифровых форматов для подготовки материалов СМИ, оформляется новое направление – журналистика данных (data journalism). Журналистика данных опирается на традиции расследовательской журналистики, «компьютерной», или «вычислительной» журналистики (computer-assisted reporting – CAR), и «прецизионной журналистики» (precisionjournalism), основанной на применении научных методов сбора и анализа данных (Meyer, 2002), получившей распространение в ведущих зарубежных массмедиа (Holovaty, 2006) и начинающей появляться в ряде российских изданий (Шилина, 2013; Шилина, Левченко, 2014).

В ведущих зарубежных изданиях растет количество материалов журналистики данных6, которые публикуются на регулярной основе в качестве отдельных проектов или в специализированных разделах. Однако, несмотря на распространенность, журналистика данных до сих пор остается явлением, вызывающим дискуссии как в среде практиков, так и в академическом сообществе. За прошедшие годы понятие не получило четкой дефиниции. Одно из наиболее распространенных определений журналистики данных принадлежит А.Б. Говарду (2014), который обозначает ее как процесс «сбора, очистки, организации, анализа, визуализации и публикации данных для создания журналистских материалов». Однако, согласно исследованию шведских ученых Э. Аппельгрен и Г. Нюгрена (2013, 2018), журналистику данных до сих трудно определить, она состоит из комбинации компетенций и навыков нескольких профессий. Если первоначально термин употреблялся для обозначения структурированных, машиночитаемых данных, используемых в журналистике вместе с традиционным текстом (Holovaty, 2006), то сегодня, как показывает практика, рамки того, что можно называть «большими данными» в материалах журналистики данных, становятся все более размытыми. Мы видим, что не всегда публикации, относимые практиками и академическим сообществом к журналистике данных, содержат в качестве первоисточника именно большие данные в их признанном понимании, часто материалы основываются на большом наборе крупных количественных данных (статистических, социологических и т.п.).

Поэтому в данном исследовании мы предлагаем разграничение «больших данных» в их принятом современными специалистами понимании как баз данных значительных по размеру и сложных по методам обработки и выделяемых нами «количественных данных» – гибридного типа данных, являющегося основой большинства публикаций зарубежной журналистики данных. Мы определяем большие данные как массивы данных огромных объемов и значительного многообразия, которые из-за их количества и сложности не могут быть собраны, сохранены и проанализированы без помощи специальных горизонтально масштабируемых программных инструментов обработки, появившихся в конце 2000-х гг. Чаще всего такие данные оформляются в базы размером от нескольких петабайт, генерируемые самыми разными источниками: социальными медиа, веб-сервисами, мобильными приложениями, Интернетом вещей и т.д. Под количественными данными мы предлагаем понимать наборы данных небольших объемов и разнообразия, которые могут быть обработаны человеком с использованием любого из существующих традиционных инструментов. Это могут быть статистические данные, данные социологических исследований, рейтинги и др., которые являются привычными информационными поводами в журналистике.

Для понимания значения больших данных в журналистике данных нами проводится исследование источников информации в публикациях, относимых к данному направлению журналистики, а также степень самостоятельности их обработки автором.

 

Степень разработанности темы исследования

Практики журналистики данных пока в достаточной степени не систематизированы и не отражены комплексно в научной литературе. Основная часть работ по исследуемой тематике носит научно-практический характер. Существующие исследования в обозначенной области находятся на стыке различных научных направлений и концепций и носят междисциплинарный характер.

Базовыми для изучения характеристик больших данных, особенностей журналистики данных, а также для изучения работы специалистов, создающих публикации на основе цифровых форматов данных, являются работы зарубежных авторов по эпистемологии журналистики данных: научные статьи С. Парази, (2015), С.К. Льюиса и О. Уэстлунда (2015), посвящённые изучению влияния феномена больших данных на современную журналистику; исследование влияния инноваций на работу журналистов А. Гюннильда (2014) и анализ последствий появления вычислительной журналистики и журналистики данных на работу в редакциях М. Коддингтона (2015). Значительное место занимают работы, посвященные изучению специфики журналистики данных разных стран, в частности исследования специфики американской журналистики данных Л. Финк и К. Андерсона (2015), исследование работы журналиста с цифровыми данными в редакциях Чикаго С. Парази и Е. Дагираль (2012) и Нью-Йорка В. Уэбера и Х. Ролла (2013). Первая попытка осмысления становления британской журналистики данных описана в статьях С. Роджерса (2008, 20117) и в работах Э. Борхес-Рэя (2016, 2017), Л. Ханнафорд (2015) и М. Найт (2015), изучающих ее качественными методами. Одна из наиболее полных классификаций материалов журналистики данных предлагается в работе Ф. Штальфа (2018). Использованию новых форматов цифровых данных в российской журналистике посвящены работы российских авторов: А. Валеевой (2017), С. Вартанова (2017), И. Радченко и А. Сакоян (2014), М. Шилиной (2013) и др.

Стоит отметить, что актуальные исследования журналистики данных, несмотря на существенный объем и обширную географию, пока носят описательный, систематизирующий характер, и лишь в 2018 г. зарубежные ученые начинают говорить о том, что накопленный эмпирический материал позволяет анализировать журналистику данных как явление и процесс (Borges-Rey, Stalph, 2018). Большинство авторов подчеркивают, что журналистика данных до сих пор находится на этапе становления, изучают ее, основываясь на методах наблюдения и интервьюирования. Исследования источников информации публикаций журналистики данных до сих пор отсутствуют.

Научная новизна нашего исследования обусловлена тем, что впервые исследуется специфика источников информации в публикациях журналистики данных и степень самостоятельности их авторов. Рассматриваются основанные на «количественных» цифровых данных и больших данных публикации, размещенные на ведущих специализированных ресурсах, созданных крупнейшими мировыми качественными изданиями и считающихся образцами интересующего нас типа журналистики.

Появление новых форматов цифровой информации, в частности больших данных, предполагает новые способы ее поиска, обработки, анализа, представления и визуализации в журналистике. Эти изменения должны находить отражение в текстах журналистских материалов, подготовленных в формате журналистики данных. Однако есть основания предполагать, что в середине 2010-х гг. влияние использования данных на источники информации материалов ведущих журналистских организаций мира оставалось минимальным.

 

Методология

Многообразие методов, используемых при изучении журналистики данных, связано с новизной, междисциплинарностью и сложной природой данного явления. Основной метод, используемый в нашем исследовании, – контент-анализ публикаций журналистики данных. Реалии журналистики данных изучаются на материалах 2014−2016 гг. Происходит обращение именно к данному периоду, так как в середине 2010-х гг. журналистика данных представляет наибольший научный интерес, начинает широко распространяться в медиа и изучаться академическим сообществом.

Рассматриваются публикации журналистики данных, размещаемые в признанных экспертами зарубежных ресурсах-эталонах данного направления. В частности, анализируются 360 публикаций журналистики данных в ведущих глобальных СМИ – газетах The Guardian и The New York Times, размещаемые в специализированных разделах посвященных журналистике данных – The Guardian Datablog и The Upshot.

Согласно проведенным подсчетам, в год на сайте The Guardian в разделе The Guardian Datablog публикуется около 60−70 материалов. Нами рассматриваются практически все материалы раздела за три года – выборка материалов близка к сплошной: 180 публикаций (по 60 в год). Данное число материалов выбирается для дельнейшего релевантного сравнения с публикациями американской журналистики данных (на примере публикаций раздела The Upshot). Публикации The Upshot изучаются с первого года существования раздела и отбираются методом простого случайного отбора (вероятностная выборка) из генеральной совокупности, равной примерно 1800 (в год в The Upshot размещаются около 600 материалов). Выборка состоит из 180 публикаций (по 60 в год).

Для понимания специфики контента журналистики данных и того, является ли журналистика данных сегодня направлением, материалы которого основываются лишь на больших данных, нами анализируются источники информации в публикациях. Типы источников разделяются на большие данные и другие типы источников информации – «количественные данные» (например, статистические данные, данные государственных документов и др.). Наличие в анализируемых публикациях больших данных определяется нами исходя из информации, предоставленной в статье: прямое указание автора на то, что при создании материала используются большие данные; упоминание автором названия ресурса или размещение в публикации ссылки на базу данных, которые в дальнейшем просматриваются нами, и в итоге ознакомления выявляется, что они содержат большие данные.

Для понимания значения больших данных в материалах журналистики данных мы обращаем внимание на то, используются ли они как информационный повод или как вспомогательная часть публикации.

Для выявления особенностей работы журналистов над публикацией журналистики данных уделяется внимание анализу источника обработки данных – сами ли сотрудники издания находят и при помощи специализированных программ обработки данных анализируют данные, присутствующие в публикации, или же они опираются на готовый анализ данных (эксперта, аналитической компании, другого источника). Подобное разграничение представляется важным для понимания степени самостоятельности работы специалистов по созданию публикаций журналистики данных и степени оригинальности материалов.

 

Результаты исследования

Результаты исследования публикаций журналистики данных показывают, что так называемая журналистика данных может быть не связана с большими данными как таковыми. Большие данные в их классическом понимании содержат менее половины рассматриваемых публикаций: 152 из 360 (74 из 180 изученных публикаций The Guardian Datablog и 78 из 180 публикаций The Upshot).

Часто в разделах, посвященных журналистике данных, размещаются совершенно различные по основе материалы, содержащие в основном «количественные данные». Так, помимо больших данных в The Guardian Datablog встречаются следующие типы источников информации: статистические данныенапример, данныенациональной службы статистики Великобритании (Office for National Statistics, ONS), данные, генерируемые аналитической компанией Ipsos Mori и исследовательского центра Pew, открытые данные государственных порталов Великобритании (Gov.Uk, YouGov8), опросные данные (например, Института Гэллапа). В публикациях The Upshot, в которых отсутствуют большие данные, источником информации часто становятся статистические данные, данные Бюро переписи населения США (National Fair Housing Alliance), Бюро статистики труда (U.S. Bureau of Labor Statistics), данные аналитических компаний, данные государственных порталов открытых данных США и др.

Таким образом, большие данные не являются обязательным компонентом публикаций зарубежной журналистики данных.

 

Большие данные в публикациях журналистики данных
Рисунок. Большие данные в публикациях журналистики данных The Guardian

иThe New York Times, 2014−2016 гг.

 

 

Таблица. Большие данные в публикациях журналистики данных The Guardian и The New York Times, 2014−2016 гг.

Год

Публикации зарубежной журналистики данных

Большие данные –

инфоповод

Большие данные как инфоповод

+

обработаны автором

Большие данные как иллюстрация

Большие данные как иллюстрация +

обработаны автором

2014

50

26

1

0

2015

40

14

8

3

2016

49

22

4

2

Итого

139

62

13

5

 

При этом анализ публикаций, основанных на больших данных, выявляет, что практически для всех из них большие данные являются информационным поводом (139 из 152): это 65 из 74 публикаций, основанных на больших данных в The Guardian Datablog (25 статей в 2014 г., 20 в 2015 г., 20 в 2016 г.), и 74 из 78 публикаций The Upshot (25 публикаций в 2014 г., 20 в 2015 г., 29 в 2016 г.). Только в 13 из 152 рассматриваемых публикаций большие данные выполняют второстепенные функции иллюстрации или дополнения (9 из 74 публикаций The Guardian Datablog и 4 из 78 публикаций The Upshot).

Результаты исследования показывают, что оригинальные данные часто обрабатываются самими сотрудниками издания (159 из 180). Как видно из контента подобных статей, авторы находят базу данных и с помощью инструментов обработки больших данных самостоятельно анализируют информацию, содержащуюся в ней. Однако выявляется различие в степени самостоятельности работы журналистов The Guardian Datablog и The Upshot. Так, журналисты The Guardian Datablog чаще берут за основу готовые исследования аналитических компаний (которые зачастую выполняются по заказу самого издания), или используют обработанные данные, находящиеся в открытом доступе. Только в трети публикаций The Guardian Datablog исходные данные обрабатываются самими авторами (58 из 180): 12 публикаций в 2014 г., 20 – в 2015 г., и 26 – в 2016 г. включают оригинальную интерпретацию данных. Среди материалов с обработанными журналистами большими данными выделяются 46 публикаций, в которых данные служат инфоповодом и 12, в которых данные являются иллюстрацией или дополнением к основным источникам информации. В четверти публикаций (18 из 74) журналистами обрабатываются исходные большие данные. Среди них в 14 публикациях большие данные являются инфоповодом, в 4 выполняют иллюстративные функции.

Степень самостоятельности журналистов The Upshot представляется более высокой, так как для большинства рассматриваемых публикаций исходные данные находятся, анализируются и обрабатываются самими сотрудниками издания (101 из 180): 36 – в 2014 г., 28 – в 2015 г. и 37 – в 2016 г. При этом в большинстве публикаций, основанных на обработанной авторами информации, эти данные служат инфоповодом (98 из 101), только в трех – иллюстрацией. Большие данные, обработанные самими журналистами, присутствуют в половине публикаций (48 из 78), в большинстве из них являясь информационным поводом для написания материала (47 из 48). Представленные в виде иллюстрации к основным источникам информации обработанные журналистами большие данные содержатся в одной статье, попавшей в выборку.

Таким образом, в результате исследования выявляется, что лишь часть материалов журналистики данных рассматриваемых специализированных разделов The Guardian и The New York Times – это публикации, содержащие именно большие данные. Они не являются обязательной составляющей публикаций.

В большинстве публикаций, которые содержат большие данные, именно они являются основным источником для написания материала, и значительная часть из них находится и анализируется авторами публикаций самостоятельно.

 

Выводы

При исследовании контента зарубежной журналистики данных выявляется, что менее половины публикаций содержат в качестве источника материала большие данные (139 из 360), что позволяет нам сделать вывод о том, что журналистика данных сегодня не обязательно основывается на больших данных как информационном поводе для написания материала, они не являются необходимой составляющей публикаций. Также большие данные не обязательно обрабатываются и анализируются при помощи специального программного обеспечения самими журналистами (лишь в 62 публикациях из 360 большие данные анализируются сотрудниками изданий самостоятельно).

Варианты журналистики данных Великобритании и США, представленные в ведущих глобальных изданиях, обладают схожими характеристиками, что позволяет нам на основе их обобщения выявить сущность феномена журналистики данных.

Результаты исследования соответствуют предложенному нами разделению «больших данных» в их принятом понимании, как баз данных огромных объемов и методов их обработки, и выделяемых нами «количественных данных» – гибридного типа данных, являющегося основой большинства публикаций журналистики данных, и позволяют провести разграничение между «журналистикой данных» в её широком понимании, охватывающем целый спектр материалов, публикуемых в соответствующих рубриках, и условной «журналистикой больших данных» – как специализированном направлении в журналистике, материалы которого создаются с использованием информации, полученной из соответствующих по масштабам и сложности обработки цифровых баз данных.

На основании полученных результатов, мы предлагаем следующее определение журналистики данных: журналистика данных – это направление в журналистике, основой материалов которого является презентация так называемых небольших по объему и разнообразию «количественных данных», которые могут служить информационным поводом или быть частью материала, обогащая его.

В то же время в работе обращается особое внимание на журналистику больших данных – направление, в основе которого лежит работа именно с большими данными в соответствии с их пониманием современными специалистами как цифровой информации, которую невозможно обрабатывать традиционными способами.

Таким образом, использование больших данных в журналистике как основных источников информации не обязательно приводит к появлению новых способов ее обработки и представления. В XXI в. трансформация журналистики происходит не настолько быстро, как это иногда представляется специалистами и академическим сообществом.

 



Примечания

  1. UNESCO Future arts, media, and entertainment: seeds for 2020. N.Y., 2011.
  2. Термин «большие данные» ввел К. Линч, редактор журнала Nature в 2008 г.
  3. Петабайт − единица измерения количества информации, равная 1015 байт.
  4. Thibodeau P. (2011) Gartner's Top 10 IT Challenges Include Exiting Baby Boomers, Big Data. Computerworld, October 18. Режим доступа: https://www.computerworld.com/article/2497348/data-center/gartner-s-top-10-it-challenges-include-exiting-baby-boomers--big-data.html
  5. Отметим, что большие данные как технологический тренд с 2015 г., согласно Gartner, трактуются более широко и включают в себя такие новые технологии использования данных, как искусственный интеллект, виртуальная реальность и др.
  6. Сегодня феномен журналистики данных становится все более актуальным. В ведущих изданиях постоянно растет количество публикаций журналистики данных The Guardian, Financial Times, The New York Times, Chicago Tribune, Texas Tribune, Las Vegas Sun и др.). В 2018 г. журналистика, основанная на анализе цифровых данных, является одним из основных трендов отрасли, согласно обзору журналистских трендов организации Poynter. В докладе говорится о «повышенном спросе» на журналистов с навыками сбора и анализа данных сегодня и в ближайшем будущем (см.: Laforme R. (2018) The Next Big Thing in Journalism Might Be Algorithm Reporters. Рoynter, March 15. Режим доступа: https://www.poynter.org/tech-tools/2018/the-next-big-thing-in-journalism-might-be-algorithm-reporters/). Согласно исследованию «Новостной Google News Lab 2017 г., большинство редакций качественных зарубежных медиа содержат в штате специалистов по созданию публикаций журналистики данных (в 56% редакций Франции, в 52% редакций Германии и Великобритании, в 46% редакций США) (cм.: Rogers S., Schwabish J., Bowers D. (2017) The State of Data Journalism in 2017. Google News Lab. Режим доступа: https://newslab.withgoogle.com/assets/docs/data-journalism-in-2017.pdf)
  7. Rogers S. (2008) Turning Official Figures into Understandable Graphics, at the Press of a Button. Guardian.co.uk. Режим доступа: https://www.theguardian.com/help/insideguardian/2008/dec/18/unemploymentdata; Rogers S. (2011) Data Journalism at the Guardian: What is It and How Do We Do It? Guardian.co.uk. Режим доступа: https://www.theguardian.com/news/datablog/2011/jul/28/data-journalism
  8. Gov.Uk. Режим доступа: https:.gov.uk; YouGov. Режим доступа: https:.yougov.co.uk /

 

Библиография

Вартанов С.А. Большие данные в онлайн-СМИ: подходы и стратегии использования // Медиаскоп. 2017. Вып. 4. Режим доступа: http://www.mediascope.ru/2375

Шилина М.Г. Data Journalism – дата-журналистика, журналистика метаданных – в структуре медиакоммуникации: к вопросу формирования теоретических исследовательских подходов // Медиаскоп.2013. Вып. 1. Режим доступа: http://www.mediascope.ru/node/1263

Шилина М. Г., Левченко В.Ю. Big Data, Open Data, Linked Data, метаданные в PR: актуальные модели трансформации теории и практики // Медиаскоп. 2014. Вып. 1. Режим доступа: http://www.mediascope.ru/big-data-open-data-linked-data-метаданные-в-pr-актуальные-модели-трансформации-теории-и-практики

 

Appelgren E. (2018) An Illusion of Interactivity. The Paternalistic Side of Data Journalism. Journalism Practice 12 (3): 308−325. DOI: 10.1080/17512786.2017.1299032

Appelgren E., Nygren G. (2013) Data Journalism in Sweden – Opportunities and Challenges. A Case Study of Brottspejl at Sveriges Television (STV). Stockholm: Södertorn University.

Borges-Rey E. (2016) Unravelling Data Journalism: A Study of Data Journalism Practice in British Newsrooms. Journalism Practice 10 (7): 833–843. DOI: 10.1080/17512786.2016.1159921

Borges-Rey E. (2017) Towards an Epistemology of Data Journalism in the Devolved Nations of the United Kingdom: Changes and Continuities in Materiality, Performativity and Reflexivity. Journalism. DOI: 10.1177/1464884917693864

Borges-Rey E., Stalph F. (2018) A Random Walk through Data + Journalism: Assessing the Data Journalism Tcosystem. Paper presented on NODA-2018 (The Nordic Data Journalism Conference), Södertörn University, Sweden, 15−17 Mar. 2018.

Coddington M. (2015) Clarifying Journalism's Quantitative Turn: A Typology for Evaluating Data Journalism, Computational Journalism, and Computer-Assisted Reporting. Digital Journalism 3 (3): 331–338. DOI:10.1080/21670811.2014.976400

Fink K., Anderson C. (2015) Data Journalism in the United States: Beyond the "Usual Suspects". Journalism Studies 16 (4): 467−481. DOI: 10.1080/1461670X.2014.939852

Gynnild A. (2014) Journalism Innovation Leads to Innovation Journalism: The Impact of Computational Exploration on Changing Mindsets. Journalism 15 (6): 713–730. DOI: 10.1177/1464884913486393

Hannaford L. (2015) Computational Journalism in the UK Newsroom: Hybrids or Specialists? Journalism Education 4 (1): 6−21.

Holovaty A. (2006) A Fundamental Way Newspaper Sites Need to Change. Режим доступа: http://www.holovaty.com/writing/fundamental-change/

Howard A.B. (2014) The Art and Science of Data-Driven Journalism. Tow Center for Digital Journalism. Columbia University. Режим доступа: https:.doi.org/10.7916/D8Q531V1

Kelly J. (2015) Executive Summary: Big Data Vendor Revenue and Market Forecast, 2011−2026.Режим доступа: https://wikibon.com/big-data-vendor-revenue-and-market-forecast-2011-2026/

Knight M. (2015) Data Journalism in the UK: a Preliminary Analysis of Form and Content. Journal of Media Practice 16 (1): 55−72. DOI: 10.1080/14682753.2015.1015801

Lewis S.C., Westlund O. (2015) Big Data and Journalism: Epistemology, Expertise, Economics, and Ethics. Digital Journalism 3 (3): 447−466.

Manyika J., Chui M., Brown B.,  Bughin J. et al. (2011) Big Data: The Next Frontier for Innovation, Competition, and Productivity. McKinsey Global Institute.

Marr B. (2016) Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results. Wiley.

Mayer-Schönberger, V., Cukier, K. (2013) Big Data: A Revolution That Will Transform How We Live, Work, and Think. UK: John Murray.

Meyer P. (2002) Precision Journalism: A Reporter's Introduction to Social Science Methods. 4th ed. Oxford: Rowman & Littlefield.

Parasie S. (2015) Data-Driven Revelation? Epistemological Tensions in Investigative Journalism in the Age of 'Big Data'. Digital Journalism 3 (3): 364−380. DOI: 10.1080/21670811.2014.976408

Parasie S., Dagiral E. (2012) Data-Driven Journalism and the Public Good: "Computer-Assisted-Reporters" and "Programmer-Journalists" in Chicago. New Media & Society 15 (6): 853–871.

Radchenko I., Sakoyan A. (2014) The View on Open Data and Data Journalism: Cases, Educational Resources and Current Trends. In: Ignatov D.I., Khachay M.Y., Panchenko, A. et al. (eds.) Analysis of Images, Social Networks and Texts. Cham: Springer, pp. 47–54.

Stalph F. (2018) Classifying Data Journalism. A Content Analysis of Daily Data-Driven Stories. Journalism Practice Pages 12 (10): 1332−1350. DOI: 10.1080/17512786.2017.1386583

Valeeva A. (2017) Open Data in a Closed Political System: Open Data Investigative Journalism in Russia. Reuters Institute for the Study of Journalism. University of Oxford. Режим доступа: https://reutersinstitute.politics.ox.ac.uk/sites/default/files/2017-10/Valeeva_Open%20data%20and%20investigative%20journalism%20in%20Russia.pdf

Weber W., Rall H. (2013) We Are Journalists. Production Practices, Attitudes and a Case Study of the New York Times Newsroom. In: Interaktive Infografiken. Springer Berlin Heidelberg, pp. 161−172.