С некоторых пор многие крупные новостные агентства и редакции перепоручают спортивную информацию, сводки о погоде, изменениях на бирже и результатах корпоративной деятельности компьютерам. Поразительный факт: машины могут обеспечивать более скрупулезный и широкий охват, чем некоторые репортеры. В отличие от многих журналистов, которые зачастую выпускают репортажи, используя один источник информации, программные средства могут импортировать данные из разных источников, распознавать тенденции и шаблоны, а также вписывать эти тенденции в контекст с помощью технологии обработки естественного языка (Natural Language Processing), выстраивая сложные предложения с прилагательными, метафорами и сравнениями. Теперь роботы могут убедительно рассказать даже об эмоциях толпы во время напряженного футбольного матча.
Именно поэтому многие представители журналистской профессии опасаются, что искусственный интеллект оставит их без работы. Однако если, отбросив опасения, журналисты примут ИИ, он может стать настоящим спасением для их ремесла — позволяя более полно отображать постоянно усложняющийся, глобализированный и богатый информацией мир, в котором мы живем.
Умные машины могут придать мощный импульс созданию сюжетов, усиливая креативность и способность журналистов увлечь аудиторию. Определенный алгоритм, следующий предсказуемым шаблонам данных и запрограммированный на «изучение» вариаций в этих шаблонах с течением времени, может помогать репортерам в организации, сортировке и создании контента со скоростью, которая никогда ранее не представлялась возможной. Он может систематизировать данные, чтобы найти недостающее звено в репортаже-расследовании, а также определять тенденции и выявлять среди миллионов точек данных отклонения, которые могут стать источником сенсационных новостей. Например, в настоящее время информационные агентства могут непрерывно вводить сведения о государственных закупках в алгоритм, способный анализировать эти данные посредством перекрёстных ссылок на компании, имеющие тот же адрес. Усовершенствование этой системы могло бы дать журналистам множество подсказок о коррупции в отдельно взятой стране.
Умные компьютеры могут не только анализировать большие объемы данных, содействуя оперативным расследованиям, но и проверять надежность источников и фактов, поступающих от аудитории. По данным Отчета Tow Centre за 2017 год, несколько информационных агентств в Соединенных Штатах уже используют ИИ для выявления фактологических ошибок. К примеру, Reuters использует инструмент под названием News Tracer для отслеживания главных событий дня в социальных сетях и проверки достоверности сообщений в Твиттере. Serenata de Amor, группа бразильских журналистов и энтузиастов в области технологий, использует робота по имени Роузи (Rosie) для отслеживания всех выплат, заявленных членами конгресса страны, с указанием причин, по которым эти расходы могут считаться подозрительными.
Существует множество других сфер, где алгоритмы помогают журналистам: от создания предварительной видео-нарезки до распознавания моделей речевых сигналов и идентификации лиц в толпе. Такие алгоритмы можно программировать для общения с читателями (чат-боты) и ответов на запросы. Примечательно, что этот процесс не может происходить без участия журналиста — человека, который, руководствуясь определенной целью, задает соответствующие вопросы о данных. Репортерам и редакторам необходимо быстро обучаться работе с этими системами и использовать их для повышения эффективности журналистской деятельности.
Большинство журналистов в мире не имеют доступа к команде программистов и специалистов по обработке данных, которые могли бы помочь им в разработке и создании собственных проектов. Единственный выход — это сотрудничество. Небольшие отделы новостей и фрилансеры могут компенсировать нехватку ресурсов, объединившись с разработчиками программного обеспечения для установления партнерских отношений на более стабильной основе. Помимо прочего, такое сотрудничество позволяет более эффективно выявлять многочисленные инструменты открытых источников в части поиска и аналитики.
Связь между журналистами и техническими специалистами нельзя воспринимать как данность. Обе стороны должны иметь достаточный объём знаний, а также некоторый опыт проб и ошибок. Благодаря непрерывному развитию технологий, современные журналисты имеют в своем распоряжении постоянно расширяющийся инструментарий, с помощью которого можно привлечь власть имущих к ответу. Сегодня услышать мнение представителей общественности и определить их потребности становится все проще, и было бы огромным упущением не попытаться это сделать.
Этические вызовы
Рассуждая о взаимоотношениях между журналистикой и искусственным интеллектом, Пол Чэдвик из The Guardian’sпредлагает включить новый пункт в кодекс газетной этики. Он отмечает, что «программные средства, которые умеют «думать», используются все чаще, но они не всегда обеспечивают этический подход к сбору или обработке информации. Обращаясь к искусственному интеллекту с целью повышения эффективности журналистики, необходимо учитывать его совместимость с ценностями этого кодекса».
Журналисты должны осознавать, что алгоритмы могут быть обманчивыми или вводить в заблуждение. Их программируют люди, у которых есть предубеждения, и логические схемы могут приводить к неверным выводам. Следовательно, журналисты должны подтверждать результаты с помощью методов, проверенных веками: осуществляя перекрестную проверку источников, сравнивая документы и подвергая сомнению полученные данные.
Прозрачность — еще одно необходимое условие для журналистов, работающих в новую эру машинного интеллекта. «Самым серьезным препятствием для принятия ИИ информационными агентствами является прозрачность. Эта базовая ценность журналистики зачастую идет вразрез с искусственным интеллектом, который обычно работает «за кулисами»», — говорит Навзикая Реннер, цифровой редактор Columbia Journalism Review.
Чтобы не потерять доверие аудитории, средства массовой информации должны информировать читателей о том, какие персональные данные они собирают. Несмотря на новые эффективные «игрушки», позволяющие им в полной мере адаптироваться ко вкусам аудитории, редакторы также должны стремиться информировать пользователей о том, чего те не хотят знать. Общественные интересы по-прежнему остаются делом СМИ и ключом к их выживанию.
Подобным образом, журналисты, которые ведут расследования, должны стремиться максимально исчерпывающе разъяснять, как они используют алгоритмы для нахождения моделей или обработки фактического материала для сюжета, если хотят отличаться от манипуляторов и демагогов, тайно собирающих сведения для использования в качестве коммерческого или политического оружия. Кроме того, здоровая журналистика должна по-прежнему давать голос тем, кто его лишен, и содействовать решению неразрешимых вопросов, по которым не проводится систематический сбор информации и не создаются массивы данных.
В конечном итоге, при неоспоримости того факта, что ИИ открывает перед журналистикой недоступные ранее возможности, также справедливо и то, что он создает новые проблемы, связанные с обучением и ответственностью за результат. Без журналистской ясности все эти технологии не приведут к надлежащему уровню информированности общества. Без этических ориентиров умные технологии могут даже означать закат журналистики. Без четких целей, прозрачных процессов и общественных интересов, используемых в качестве компаса, журналистика может утратить доверие людей, независимо от того, сколькими схемами, ботами и бантиками вы ее украшаете.
Мария Тереза Рондерос,
Директор, Программа независимой журналистики
Примеры использования ИИ в журналистике
Автоматизированная журналистика: создание сюжетов на основе данных. Первоначально эта технология использовалась в спортивных репортажах и финансовых новостях. Она может освободить журналистов от рутинных задач, повысить эффективность и снизить затраты. AP («Ассошиэ́йтед Пресс») использует программу Wordsmith, создающую репортажи на основе финансовых данных. В редакции Washington Post используется технология Heliograf собственной разработки для освещения спортивных мероприятий и предвыборной гонки.
Организация рабочего процесса: отслеживание главных новостей дня, комбинирование и группирование новостей с использованием ярлыков и ссылок, модерирование комментариев и автоматическая транскрипция голоса. The New York Times использует инструмент API (интерфейс прикладного программирования) под названием Perspective, разработанный Jigsaw (Alphabet/Google), для модерирования комментариев читателей. Платформа Reuters Connectдля журналистов отображает весь контент Reuters, включая архив, а также контент медиа-партнеров по всему миру в режиме реального времени.
Отслеживание новостей в социальных сетях: анализ оперативных данных и данных прошлых периодов с определением источников влияния и вовлечением аудитории. AP использует инструмент Newswhip для мониторинга тенденций и активности пользователей социальных сетей.
Взаимодействие с аудиторией: чат-бот приложение Quartz Bot дает пользователям возможность задавать вопросы в текстовом формате, касающиеся новостей, конкретных людей или мест, и отвечает на них, используя контент, который считает подходящим. В числе других инструментов можно упомянуть боты для приложения Facebook Messenger, такие как чат-бот Guardian. Компания BBC использовала боты для более широкого освещения референдума в ЕС. Темой проекта AfriBOT, который входит в число проектов, получивших грант фонда Innovate Africa, и реализуется Европейским центром журналистики совместно с The Source (Намибия и Зимбабве), является разработка новостного бота с открытым кодом, призванного «содействовать информационным агентствам Африки в выпуске персонализированных новостей и более эффективному взаимодействию с аудиторией посредством платформ обмена сообщениями».
Автоматическая проверка фактов на достоверность: позволяет журналистам оперативно проверять публичные заявления или официальные сообщения на наличие фактологических ошибок. Компания Chequeado (Аргентина) создала бот Chequeabot; Full Fact (Великобритания) и партнеры разрабатывают программу автоматизированной проверки на достоверность для «обнаружения заявлений, факты которых уже подвергались проверке, в новых местах, а также автоматического определения и проверки новых заявлений с помощью инструмента обработки естественного языка (Natural Language Processing) и структурированных данных». Компания Duke Reporter’s Lab (США) разработала инструмент ClaimBuster с целью доведения до СМИ политически значимых сообщений и в 2017 году создала центр проектов автоматической проверки фактов. Компания Factmata в Великобритании также разрабатывает инструмент автоматической проверки данных на достоверность. Дополнительную информацию см. на сайте.
Анализ баз данных большого размера: программные средства обрабатывают данные, а также отслеживают шаблоны, изменения или необычные явления. Инструмент Lynx Insight, используемый Reuters,обрабатывает массивы данных большого объема и предоставляет журналистам результаты и дополнительную информацию. Подразделение по выявлению шаблонов преступных деяний (Crime Pattern Recognition) при Центре по исследованию коррупции и организованной преступности (OCCRP) использует технологию, позволяющую анализировать объемные базы данных о преступлениях, связанных с коррупцией, и связях между вовлеченными сторонами.
Распознавание изображений: использование технологии, которая может распознавать объекты, места, лица людей на изображениях и даже их настроения. The New York Times использует инструмент Rekognition API от Amazon для идентификации членов конгресса на фотографиях. Любой пользователь может бесплатно протестировать технологию распознавания изображений Vision API от Google.
Видеопроизводство: автоматическое создание скриптов на основе новостных статей и формирование черновой нарезки коротких видеосюжетов из отснятого видеоматериала. USA Today, Bloomberg и NBC используют программу Wibbitz. Исследователи Стэнфордского университета занимаются разработкой инструмента автоматического видео-редактирования.
Первоначально эта статья была опубликована в октябрьском выпуске бюллетеня Программы независимой журналистики Фонда «Открытое общество» (Open Society Foundation) в 2018 году и перепечатана с разрешения. Примечание: OSF является спонсором GIJN.
Мария Тереза Рондерос – директор Программы независимой журналистики (OSF Program on Independent Journalism), которая координирует усилия по продвижению жизнеспособных, высококачественных СМИ, особенно в странах, строящих демократию. Рондерос пришла в OSF из ведущего колумбийского новостного журнала Semana.
Ждем когда данные программы и алгоритмы станут доступны массовому потребителю!