Глубинная сеть для журналистики: 7 рекомендаций по использованию базы данных OCCRP

Print More

English

Примечание редактора. Команда data-инженеров Центра по исследованию коррупции и организованной преступности (OCCRP) разработала новые элементы для платформы OCCRP Data, переименовав её в Aleph и объединив более 250 публичных баз данных из более чем 140 юрисдикций с возможностью поиска по всем одновременно! Однако общие принципы работы с базой остались прежними, поэтому начинающие могут воспользоваться инструкциями, изложенными ниже. 

OCCRP Data, один из ресурсов «Информационного портала расследователя» (Investigative Dashboard), предлагает журналистам быстрый доступ к сведениям из глубинной сети. На сегодня он содержит более 170 публичных источников и свыше ста миллионов элементов информации для открытого поиска.

Речь идет о новостных архивах, судебных документах, сведениях из утечек, а также о материалах узкой направленности, включая парламентские запросы британских депутатов, базы данных коммерческих компаний и закупок, отчеты неправительственных организаций и даже данные о полетах неофициальных «воздушных тюрем ЦРУ».

Все это данные из открытых источников. Если вы связаны со структурой OCCRP, у вас будет доступ более чем к 250 миллионам массивов данных.

Уникальность этой базе данных добавляет наличие в ней санкционных списков, имеющих отношение к политике или криминалитету.

Новая платформа предоставляет пользователю как никогда «компактный» поиск различных типов информации, таких как электронные письма, документы, содержимое корпоративных или земельных реестров, причем каждый вид информации отображается максимально удобным образом.

Вот несколько подсказок, как наиболее эффективно применять OCCRP Data.

Отбирайте нужное прямо в браузере

В OCCRP Data есть электронные письма, документы в формате PDF и Word, старые новостные архивы и даже поэмы Редьярда Киплинга (последние, если честно, из WikiLeaks). Абсолютно новый интерфейс позволяет вам видеть документы, вести по ним поиск и просматривать в браузере без необходимости скачивать или открывать их. Тем самым процесс поиска ускоряется и становится более «плавным».


Новые варианты поисковых фильтров

С OCCRP Data вы можете фильтровать результаты проделанного поиска по источникам, типу документа, а также по электронным письмам, телефонным номерам, адресам, названиям структур, стран и другим параметрам, указанным в колонке слева.

Выделяйте связи

Вы можете исследовать структурированные данные по-новому, потому что OCCRP Data использует извлечение объекта по документам и электронным письмам для поиска телефонных номеров, имен людей, названий компаний, адресов, номеров удостоверений личности и других интересующих вас ключевых связующих деталей. Просто кликните по объекту, и увидите опции тегов на экране предварительного просмотра.


Сравнивайте большие массивы данных

OCCRP Data может находить перекрестные ссылки по двум спискам данных. Платформа в определенном порядке выводит совпадающую информацию и позволяет вам сравнивать сведения. Сначала кликните на источнике, затем кликните на опции «перекрестные ссылки» (Cross Reference), чтобы выбрать другой источник, с которым будет производиться сравнение.


Следите за поисковым запросом, получайте уведомления

В OCCRP Data теперь есть функция уведомления, позволяющая отслеживать появление данных по искомым элементам: когда в базу данных добавляется новая информация, вы получите сообщение об этом. Просто активируйте иконку колокольчика справа, рядом с вашим поисковым запросом.


Поддержка иностранных языков

Содержание OCCRP Data теперь доступно не только на английском. Интерфейс переведен и поддерживает русский язык, а также боснийско-сербско-хорватский. Команда data-инженеров работает над добавлением и других языков, например, испанского и немецкого.

Функционал расширенного поиска

Используйте функциональные возможности усложненного расширенного поиска, если вам нужен поиск с учетом расстояния между ключевыми словами, поиск точного сочетания, комбинированные запросы или учет орфографических ошибок.


Хотите задать вопрос?

Каждый пользователь OCCRP Data может познакомиться с информацией на Aleph Wiki, где команда data-инженеров рассказывает о применении ресурса, его функциях и концепции развития. И журналистам, и техническим специалистам предлагается прочесть руководство пользователя. С нами также можно связаться по электронному адресу data@occrp.org, чтобы оставить отзыв.

_____________________________________________
Центр по исследованию коррупции и организованной преступности (OCCRP) — журналистский проект, объединяющий 40 некоммерческих расследовательских центров, десятки независимых журналистов и несколько крупных региональных новостных СМИ в разных частях света.

Leave a Reply

Your email address will not be published. Required fields are marked *