В рубрике Мои любимые инструменты мы поговорим с Барбарой Маседой, основательницей и редактором Proyecto Inventario – платформы открытых данных для журналистов, которые пишут о её родной Кубе.
Слабое проникновение интернета в жизнь страны и недостаточная прозрачность государства сильно осложняют – а иногда и делают невозможным – поиск даже самых базовых данных для репортажей и расследований. Закончив факультет журналистики Гаванского университета, Маседа несколько лет посвятила разработке метода количественного подхода к новостям, в том числе, в Бирмингемском университете в Великобритании.
Обучаясь в Стенфордском университете по стипендиальной программе им. Джона Найта, в 2018 году она основала Proyecto Inventario. Целью ее проекта стало облегчение доступа к данным о разных сферах жизни на Кубе для независимых журналистов.
С начала пандемии коронавируса Proyecto Inventario стал основным источником данных о распространении вируса на Кубе. Проект собирает информацию про выявленные случаи и упорядочивает по дате, месту и особенностям пациента. Визуализации Proyecto Inventario, подготовленные с помощью платформы Flourish, используются несколькими независимыми СМИ на Кубе.
Маседа, недавно ставшая участницей стипендиальной программы TED2020, сама управляет Proyecto Inventario: ведёт страницы в социальных сетях, отвечает на вопросы журналистов и планирует дальше развивать инициативу с помощью краудфандинга и получения грантов.
Вот некоторые её любимые инструменты, которыми она пользуется для преодоления сложностей с журналистикой данных о Кубе и на Кубе.
Klaxon
«Можно по-разному автоматизировать выявление изменений на веб-сайтах. В Proyecto Inventario мы пользуемся функциями Klaxon. Это онлайн-инструмент, созданный проектом Маршала (The Marshall Project). Klaxon очень удобен, позволяет отслеживать много веб-сайтов и компонентов различных веб-страниц. Можно детально настраивать всё под свои потребности, фокусироваться на отдельных элементах – поэтому он вполне нам подходит.
Klaxon вообще хорошее подспорье в журналистской работе, но на Кубе в особенности: большинство государственных веб-сайтов у нас не дают подписаться на обновления, если хочешь узнавать о появлении новой информации или данных. Кроме того, независимая журналистика на Кубе – вне закона, так что у нас практически нет контакта с пресс-секретарями государственных учреждений. Поэтому автоматические уведомления об изменениях на веб-сайтах — это конечно же один из лучших вариантов для своевременного получения сообщений о публикации новой официальной информации.
Например, мы отслеживаем официальное хранилище кубинских законов, Gaceta Oficial. Благодаря Klaxon мы в течение часа получаем уведомление о публикации нового нормативно-правового акта, и можем привлечь внимание журналистов или редакторов, которые работают над соответствующими темами.
«Другой способ использования Klaxon — это несовершенная, но эффективная замена скрейпера, который регулярно запускается в облаке. Если у вас нет навыков или времени для настройки собственного скрейпера, то можно с помощью Klaxon собирать и сохранять таблицы данных или списки, или любой другой источник данных с конкретного веб-сайта по мере их обновления».
Sublime Text
«В Sublime Text мне нравится, что его можно использовать для создания своего рода локального поискового сервера на вашем компьютере. Если у вас локально в виде текстовых файлов хранятся сотни и тысячи документов, то с помощью этого мощного текстового редактора можно находить те данные, которые будут наиболее актуальными в вашем расследовании. Прочитайте чудесный учебник Фридриха Линденберга «Инструментарий бедного журналиста для майнинга текстовых данных», если вы хотите научиться работать с этим инструментом.
В стране, где совсем мало информации доступно онлайн, в журналистской работе мы часто опираемся на сливы документов и баз данных, которые получаем из рук в руки на флэшках. Как раз для таких случаев инструмент очень полезен. Я бы сказала, он пригодится даже если информация есть онлайн, но формат не оптимален для пользователей и поисковых систем.
Взять опять-таки публикации кубинского законодательства. Долгое время новые акты в хранилище публиковались в виде файлов PDF, сжатых архиватором в RAR. В таком случае полезно скачать веб-сайт целиком, преобразовать всё в нужный формат, а потом упорядочить информацию так, чтобы упростить журналистам поиск».
Wayback Machine
«Все любят Wayback Machine, а мы – тем более, ведь у нас в стране публичные реестры работают очень криво. Веб-страницы и даже целые сайты на Кубе постоянно оказываются недоступны, поэтому такой ресурс как Wayback Machine очень выручает, предоставляя доступ к сохранённым ранее версиям.
Одна из проблем в доступе к данным возникает, когда госучреждение удаляет старые записи при размещении нового набора данных. Например, в самой последней версии реестра несельскохозяйственных кооперативов не содержится сведений о компаниях, которые прежде вносились в реестр, но затем были из него исключены. С помощью Wayback Machine мы получили предыдущие версии этого реестра и добавили все неактивные или закрывшиеся кооперативы в базу данных, доступную журналистам и всем желающим.
Wayback Machine также может быть отличной нейтральной стороной для создания копий веб-сайтов, которые, на ваш взгляд, могут исчезнуть, поменяться или просто очень важны для вашего расследования. Мы создали базу данных по всем перелетам кубинских врачей из Бразилии назад на Кубу в конце 2018 года после отмены программы Mais Médicos. Перед публикацией мы убедились, что все новостные статьи, из которых мы брали информацию о количестве медиков на каждом рейсе, были сохранены в Wayback Machine. Это важная мера предосторожности для тех, кто освещает работу правительства, которое любит дискредитировать критические статьи и ставить под сомнение правдивость репортёров.»
Video Street View
Строго говоря, это не инструмент, а идея, которая может быть полезна журналистам в странах, где нет Google Street View, как на Кубе. Столкнувшись с невозможностью воспользоваться Google Street View как инструментом геолокации для OSINT (сбора информации из открытых источников) как в других странах, мы нашли альтернативу. Люди постят целые часы видеозаписей с кубинских улиц на платформах в социальных сетях, например YouTube, Facebook, Twitter и других. Обычно это видео, записанные кубинцами, живущими за рубежом, которые приезжают проведать свои семьи и хотят запечатлеть ностальгические сцены из тех районов, где они когда-то жили, или маршруты, по которым они ходили на работу.»
DocumentCloud
«В Proyecto Inventario большая часть нашей работы состоит в структурировании информации, содержащейся в документах. Этот процесс облегчает ресурс DocumentCloud, где есть все функции для обработки документов: распознавание текста, извлечение элементов и так далее.
Но кроме всех этих функций DocumentCloud, которые полюбились многим журналистам, мне также нравится возможность доступа к документам, которыми делятся другие пользователи. Там можно найти информацию про мою страну. Поиск по открытым документам — отличный способ узнать пару деталей про Кубу, которые может быть были вообще не имели значения для того коллеги или редакции, которые проводили расследование и размещали эти документы, а для меня могут оказаться очень важными.»
Kumu.io
«Визуализация связей в социальных сетях, отображение холдинговых структур, создание генеалогических древ — вот основные задачи, которые Kumu.io облегчает чуть ли не каждый день. Мы много анализируем социальные сети. Удобно, что сетевые карты Kumu.io можно легко встроить и обновить, внеся изменения в открытый документ Google Sheet с исходными данными — хотя можно использовать и другие варианты источников.»
Кристина Пуга – журналистка из Нью-Йорка, которая пишет для NBCNews.com о латиноамериканском сообществе в США. Она также создала сайт WiserWithAge.com, где рассказывает о вдохновляющих людях в возрасте 60 лет и старше, чтобы передать их мудрость младшим поколениям.