В новом выпуске серии GIJN «Мои любимые инструменты» мы пообщались с Романом Аниным, 33-летним сооснователем и главным редактором Важных историй – некоммерческого сайта расследовательских новостей из России.
Издание основано в 2020 году, редакция находится в Москве и насчитывает 13 сотрудников. Темы расследований весьма разнообразные: преследование оппозиционного политика Алексея Навального, кумовство на рынке утилизации отходов и тесты на антитела к коронавирусу с сомнительным результатом.
Роман Анин родился и вырос в Молдове. Изначально он собирался стать профессиональным футболистом, но в возрасте 17 лет из-за переезда с родителями в Россию ему пришлось уйти из молодежной команды. Желая сохранить связь с любимой игрой, Роман решил стать спортивным комментатором, изучал журналистику в МГУ, а в 2006 году устроился спортивным обозревателем в известное московское издание «Новая газета».
«Новая газета» — многострадальное издание расследовательской направленности: за период с 2000 года шестеро сотрудников были убиты. Анин в нём не просто освещал спортивные мероприятия, но и расследовал коррупционные скандалы в футболе, в том числе договорные матчи.
В августе 2008 года, когда большинство коллег были в отпуске, разразилась российско-грузинская война. «Новая газета» командировала Анина вести репортажи с передовой. С момента возвращения и до начала текущего года он проработал в расследовательском отделе газеты. Среди тем его репортажей — печально известные хищения, раскрытые адвокатом и налоговым аудитором Сергеем Магнитским; разоблачения в «Панамских документах» Сергея Ролдугина — миллиардера-виолончелиста и старого друга Владимира Путина; коррупция в контрактах на строительство объектов для зимних Олимпийских игр 2014 года в Сочи; дело Аслана Гагиева, обвиняемого в создании преступной группировки, совершившей ряд нашумевших убийств. Некоторые из этих расследований он проводил в сотрудничестве с международным консорциумом OCCRP, членом которого является с 2009 года.
Роман Анин получил множество наград за свои репортажи, в том числе Международную журналистскую премию братьев Найтов (2013) за освещение дела Магнитского, и три самые престижные российские награды в отрасли расследовательской журналистики: премии имени Артема Боровика, Юлиана Семенова и Андрея Сахарова. В 2020 году Международный центр для журналистов также наградил его премией «Первопроходец» (Knight Trailblazer Award) за создание «Важных историй». После выхода его статей о Магнитском в нескольких странах были возбуждены уголовные дела, материалы о строительстве в Сочи побудили тогдашнего президента Дмитрия Медведева потребовать расследования. Но, как и следовало ожидать, в стране, которая в 2020 году заняла 149-е место из 180 во Всемирном индексе свободы прессы организации «Репортеры без границ», российские власти обычно смотрят на его расследовательскую деятельность неодобрительно. (Со своей стороны Анин признает, что Россия — «не самая безопасная страна» для журналистов, но добавляет, что в некоторых других местах ещё хуже.)
2018-19 учебный год Роман Анин провел в Стэнфордском университете по стипендии для журналистов им. Джона Найта, посещая занятия по программированию и психологии: по его словам, оба этих навыка полезны для журналистики. Там и возникла идея «Важных историй».
Вот что Роман рассказывает о своих любимых инструментах:
VeraCrypt
«VeraCrypt позволяет создавать зашифрованные папки для безопасного хранения данных. До VeraCrypt я использовал TrueCrypt, о котором узнал от Джулиана Ассанжа, работая над Cablegate, утечкой дипломатических телеграмм США.
Я приехал в Лондон, чтобы получить у WikiLeaks телеграммы из посольства США в России. Эти данные нельзя было открыто перевозить и хранить ни на ноутбуке, ни даже онлайн; пришлось прибегнуть к безопасному хранению. Для этого я поместил данные в зашифрованные папки. Если бы кто-то проверил мой ноутбук, эти папки не нашли бы; а если бы и нашли, то не смогли бы их расшифровать.
Теперь я использую VeraCrypt — инструмент с открытым исходным кодом, который выполняет ту же задачу. С его помощью можно создавать зашифрованные папки у себя на компьютере и, по желанию, загружать их в интернет. Инструмент также позволяет замаскировать папку, чтобы она была похожа не на папку с данными, а на приложение или фильм.
Я пользуюсь VeraCrypt каждый день для шифрования всех своих расследовательских материалов».
LastPass
«LastPass хранит зашифрованные пароли. Он также позволяет синхронизировать ваши устройства, чтобы на всех них ваши пароли хранились безопасно. Затем вы получаете доступ ко всем своим паролям на LastPass благодаря мастер-паролю. Этот инструмент позволяет использовать множество сложных паролей и часто менять их, не запоминая их все. Я пользуюсь им ежедневно.
Я знаю, насколько важна безопасность, потому что однажды меня взломали. Взлом был очень изощренным: хакеры заблокировали мою SIM-карту и создали ее дубликат; затем они запросили код для восстановления моей учетной записи Gmail на мой номер телефона, который они получили на выданную SIM-карту. Мой совет тем, кто работает в коррумпированных странах с авторитарным правительством, таких как Россия: никогда не используйте номер телефона в качестве средства восстановления или для двухфакторной аутентификации. (Вместо этого в качестве второго фактора я использую Google Authenticator.)
Но мой случай — редкость. Большинство людей взламывают потому, что они используют слабые пароли или, что еще хуже, используют один и тот же пароль для разных учетных записей. LastPass поможет вам избежать этой ловушки. У вас может возникнуть вопрос: «Если LastPass взломают, раскроются ли все мои пароли?» Ответ: нет. Сервер LastPass действительно взламывали, но ни один пароль украсть не удалось, потому что LastPass хранит не пароли, а только хешированные версии паролей, которые невозможно расшифровать».
OpenRefine
«OpenRefine позволяет очищать неупорядоченные данные, что иногда бывает очень сложно. В большинстве случаев я пользуюсь Python, но для тех, кто не умеет программировать, OpenRefine — действительно отличный инструмент.
Представьте, что у вас имеется таблица с миллионами строк данных о государственных контрактах. Конечно, в таком огромном количестве данных будут ошибки, например, в названиях поставщиков; возможны ошибки в датах; некоторые строки могут отсутствовать; цены могут быть записаны в разных форматах. Как же все унифицировать и привести к общему знаменателю? Как рассчитать среднее значение? Для начала все данные нужно привести к одному формату — назовем это очисткой данных. OpenRefine с легкостью позволяет это сделать.
Я пользовался OpenRefine в работе над материалом об управлении отходами: у меня были тысячи строк данных о разных свалках, расположенных в разных регионах. Я хотел определить, где находятся самые большие свалки.
Сначала я воспользовался программой Tabula, с помощью которой извлек таблицы из общедоступных PDF-файлов в Excel, затем загрузил эти таблицы Excel в OpenRefine. Без OpenRefine это было бы практически невозможно. Мне пришлось бы просмотреть каждую строку электронной таблицы, чтобы проверить, все ли в одном формате.
Раньше на очистку данных у меня шли месяцы».
Программирование
«Я программирую на двух языках: Python и JavaScript. В основном я использую Python для сбора и анализа данных, автоматизации некоторых задач, а JavaScript — в частности, библиотеку JavaScript D3 — для визуализации данных.
Один из наших первых материалов на сайте был о госзакупках. В связи с недавним всенародным голосованием по изменению конституции я решил оценить, сколько денег государство на это потратило, и какие именно это были расходы.
Без программирования это было бы невозможно, ведь я собрал информацию по 400 000 открытых закупок. Мне нужно было их все проанализировать, найти самые крупные закупки, отсортировать, выявить закономерности. Для анализа данных я воспользовался Python. Полученный материал оказался одним из самых популярных на нашем сайте. Я обнаружил, что государство потратило большие деньги на закупки многих миллионов масок и средств защиты для сотрудников избирательных участков, в то время как для врачей средств защиты от коронавируса не хватало. Это показывает, каковы приоритеты правительства.
Работа над материалом заняла у меня около недели. Без программирования это было бы невозможно. Как еще я бы проанализировал 400 000 записей?
Это расследование вдохновило меня на создание специального инструмента. Я написал на Python небольшое приложение, которое собирает информацию, ежедневно публикуемую на официальном сайте федеральных закупок, и объединяет эти данные с информацией из реестра предприятий. Затем выполняется поверхностный, но весьма полезный анализ поставщиков, упомянутых в этих закупках: Когда было основано предприятие? Сколько человек на нем работает? Каковы его обороты? Кто владелец? И так далее. Затем приложение компилирует ответы в HTML-файл, который ежедневно рассылает мне и моим журналистам по электронной почте. Это экономит нам много времени.
Раньше я проверял базу данных о закупках время от времени, когда у меня появлялась свободная минута. Теперь это происходит автоматически. На чтение рассылки у меня уходит всего несколько секунд».
База данных арбитражных судов Российской Федерации
«В России, наверное, самая лучшая общедоступная база данных арбитражных судов в мире. Она совершенно бесплатна, и в ней предусмотрена уникальная возможность — поиск по ключевым словам. В большинстве судебных баз данных можно выполнять поиск только по наименованиям сторон, а в этой возможен поиск по любым ключевым словам по тексту постановлений всех арбитражных судов России, с получением результатов в формате PDF.
В этой базе данных не производится поиск по материалам дел и по протоколам судебных заседаний; доступны только судебные решения. Но в них кратко излагается суть дела и окончательный вердикт, это очень полезный ресурс.
Расследуя деятельность компании, я ищу ее наименование в этой базе данных, чтобы узнать, участвовала ли она в каких-либо судебных спорах.
Однажды я ради интереса запустил поиск по ключевым словам «мошенничество», «миллиарды» и «Газпром» — захотел узнать, причастен ли российский газовый гигант «Газпром» к каким-либо делам о мошенничестве на миллиарды рублей. Мне удалось обнаружить случай, когда налоговая инспекция подала в суд на одну из дочерних компаний «Газпрома» за закупку оборудования по завышенной цене через офшорную компанию. В итоге об этом вышла статья».
Базы данных UN Comtrade и Import Genius
«Одна из моих любимых онлайн-баз данных — United Nations Comtrade Database. Она позволяет узнать об экспортно-импортных потоках между разными странами. База довольно проста в использовании и позволяет выполнять поиск по конкретной стране-импортеру и экспортеру, по конкретному товару и временному отрезку.
Россия ввела санкции в отношении различных европейских стран —прекратила закупки ряда товаров из стран, которые ввели санкции против России. Журналисты захотели узнать, как это отразится на импорте товаров в Россию. UN Comtrade позволяет это сделать, указав Россию в качестве импортера, а все остальные страны — в качестве экспортеров. Так вы узнаете, сколько именно этого товара импортировали, и на какую сумму. Вот лишь один из возможных примеров использования этой базы данных. Я часто ею пользуюсь, в том числе чтобы узнать, куда Россия официально экспортирует вооружение. (Неофициальная торговля в базе не отражается.)
Недавно я пользовался этой базой после огромного взрыва селитры в Бейруте 4 августа. По сообщениям СМИ, перед остановкой в Бейруте судно, перевозившее эти грузы, направлялось в Мозамбик. Мне стало интересно, у кого Мозамбик покупал взрывчатые вещества. Я обнаружил, что большая часть селитры в эту страну ввозится из Украины, вот мы и предположили, что и сейчас выйдем на Украину. На самом деле, мы вышли на Грузию — еще одного экспортера аммиачной селитры в Мозамбик. База данных не раскрывает происхождение данной конкретной партии, но предоставляет общие сведения об импорте этого продукта Мозамбиком.
Чтобы узнать о конкретной поставке, можно воспользоваться другой базой данных, которая мне очень нравится, хоть и обходится довольно дорого: Import Genius. Чтобы ею пользоваться нужна подписка. [По состоянию на октябрь 2020 г. доступны варианты ежемесячной подписки стоимостью от 99 до 399 долларов США.]
В ней предоставляются данные о конкретных поставках и сторонах, участвующих в экспортно-импортных операциях. Можно выполнить поиск по наименованию интересующей вас компании или по ее регистрационному номеру».
Оливье Холми – французско-британский журналист и переводчик из Лондона. Он был автором журналистских расследований о финансах на Ближнем Востоке и в Африке для журнала Euromoney Magazine, а также писал некрологи для The Independent.