Entre las redacciones que buscan comprender mejor cómo la inteligencia artificial (IA) podría usarse para recopilar noticias, con fines narrativos y de negocio, La Nación es pionera. El periódico argentino, con 150 años de antigüedad, ha producido una gran variedad de artículos con apoyo de tecnologías de IA y ha creado un laboratorio de inteligencia artificial.
Los experimentos de La Nación con la IA comenzaron con una investigación sobre la energía renovable en Argentina. En 2016, Mauricio Macri, quien era el presidente argentino en ese momento, lanzó un programa para abrir los recursos de energía renovable a la inversión privada e internacional. Florencia Coelho, nueva investigadora de medios en La Nación, inspirada por una iniciativa para mapear los paneles solares en Estados Unidos que encontró como JSK Knight Journalism Fellow en Standford, presentó un proyecto para mapear el progreso del nuevo programa gubernamental cuatro años después de su inicio.
Los datos de La Nación hicieron despegar el proyecto en colaboración con Mathias Felipe, profesor invitado de la Universidad de Navarra en España. El equipo usó machine learning y visión artificial; y trabajó con un laboratorio externo especializado en análisis geoespacial e IA. El algoritmo de La Nación se programó para identificar la forma de los parques solares en Argentina. Las computadoras analizaron y comprendieron elementos visuales. Se usaron 10.999 imágenes para entrenar al algoritmo. Luego se procesaron 7 millones de imágenes y se analizaron 2.780.400 kilómetros cuadrados (1.074.000 millas cuadradas) de terreno. Los datos sugerían que el programa gubernamental no había cumplido sus objetivos.
El proyecto produjo ciertos desafíos. Acceder a las imágenes satelitales es costoso. No tenían suficientes fotografías de parques solares en Argentina en 2019 para entrenar el modelo, así que se tuvieron que usar de Chile. “No podíamos mapear los paneles solares en Argentina porque requería imágenes de muy alta definición. Así que nos centramos en los parques solares ya que el machine learning observa formas y este era un patrón más fácil de identificar”, afirma Coelho.
Por último, La Nación necesitaba una infraestructura y habilidades que no tenía aún en la redacción para producir este reportaje. “No teníamos todo el hardware y potencia informática que necesitábamos para este proyecto, por eso colaboramos. Usamos datos para tener un impacto positivo”, mencionó Coelho.
Análisis de letras de canciones de Trap
A partir de esta experiencia, el equipo de datos de La Nación aprendió los beneficios de la colaboración. También entendió que hasta que sus conocimientos sobre IA se ampliarán, quizás no podrían hacer las preguntas correctas, como las necesarias para probar qué tan preciso es un modelo. Crear un laboratorio de IA con periodistas, analistas de datos y desarrolladores para trabajar en proyectos de IA dentro de la redacción de La Nación ha ayudado a acelerar este proceso de aprendizaje. Sin embargo, ninguno de los siete miembros del personal trabaja en el laboratorio a tiempo completo, ya que tienen otros compromisos en la sala de redacción.
El primer trabajo del laboratorio fue un análisis de las letras de canciones de trap que duró siete meses. Gabriela Bouret y Delfina Arambillet lideraron el proyecto, en el cual Coelho no participó. El equipo usó machine learning, procesamiento de lenguaje natural, la API de Spotify y letras de genius.com para procesar 692 canciones y conocer los temas, tendencias y mensajes de este género musical cada vez más popular en Argentina. La IA que usaron los periodistas se enfrentó a algunos problemas lingüísticos, incluyendo las palabras inventadas que usan en las canciones de trap. Una herramienta interactiva con un extenso diccionario de trap, un “egómetro” que mide cuántas veces menciona su propio nombre un artista y otros análisis de distintivos del género les permitió a los lectores explorar los resultados.
Gran parte de lo que aprendieron, según Coelho, se puede aplicar a otro tipo de música o incluso distintos textos. “Hoy el tema era el trap, pero mañana podríamos usar esto para un discurso político o un tópico diferente”, afirma la analista de datos Gabriela Bouret.
Traer nuevas tecnologías, procesos de reportaje y temas también ha puesto presión a las redacciones. “Era una publicación muy diferente para La Nación”, señala Bouret. “Era un periódico muy tradicional y el trap está dirigido a personas muy jóvenes. Es muy distinto a lo que nuestra audiencia espera de nosotros y nos aleja de lo común”.
Los experimentos de La Nación también revelaron que la IA se ha creado o entrenado para el idioma inglés y para audiencias en el hemisferio norte. “Todos los modelos [de procesamiento de lenguaje natural] se han preparado para el idioma inglés”, comenta Bouret. “Fue muy difícil para nosotros encontrar las bibliotecas y procesos que nos ayudaran a lidiar con el problema del idioma español [para el proyecto de trap]”.
IA para la cobertura electoral
En 2021, la redacción volvió a usar la visión artificial para detectar errores en los telegramas provenientes de los centros de votación durante las elecciones parlamentarias en Argentina.
Se trabajó con una empresa externa para identificar las incongruencias en los telegramas, que registraban detalles como la cantidad de votos obtenidos por cada partido y cuántos monitores electorales estaban presentes. Luego, se les pidió a voluntarios humanos que examinaran cuidadosamente los registros marcados.
La Nación usó su plataforma VozData, donde los lectores han colaborado en investigaciones de datos y también han trabajado con iniciativas de transparencia y universidades. Los ayudantes humanos refinaron el algoritmo: debía ajustarse para procesar telegramas con errores o que se habían subido al revés. Los resultados sugirieron que 95 % de los telegramas se había llenado de manera correcta, pero 5 % le faltaba información.
Colaborar con terceros trajo otro uso de la visión artificial a la redacción y mostró lo que podía hacer en un contexto distinto. Coelho espera que este modelo se pueda usar para monitorizar futuras elecciones y animar a los funcionarios a llenar los telegramas de forma adecuada. “Me parece bien que el gobierno sepa que estás usando inteligencia artificial para encontrar matices en la documentación”, afirma.
Conseguir tiempo para proyectos de IA
Una de las mayores dificultades para las redacciones que quieren implementar más proyectos de IA es comprender y proteger el tiempo que puede tardar. No hay una meta de cuántos proyectos produce el laboratorio en un año, esto depende del trabajo que se realiza y qué otras exigencias tienen los miembros del equipo.
“Estos proyectos pueden tardar de cinco a siete meses, son a largo plazo. Es difícil para las redacciones comprenderlo, porque siempre tienen prisas. Debes ser paciente. Una vez a la semana tenemos una reunión para trabajar en esto, porque, de lo contrario, las demás cosas te desbordan”, dice Bouret.
“Los periodistas de investigación pueden pasar un año investigando la corrupción o un suceso. Somos periodistas de investigación de tecnología”, añade Coelho. “Realizamos estos proyectos y aprendemos haciendo con este laboratorio. Cuando tengamos suficiente información, podremos reaccionar con mayor rapidez”.
Según Coelho, la colaboración –sea con especialistas en IA externos, departamentos de universidades o expertos académicos– puede ayudar a las redacciones a acelerar el proceso y reducir los costos de introducir nuevas tecnologías. Trabajar con un medio puede brindar un caso práctico para una clase o investigación académica, mientras que las start-ups suelen estar interesadas en probar sus herramientas y modelos de IA para ayudar a las organizaciones de noticias a resolver un problema.
La Nación también ha obtenido financiamiento de terceros para parte de su trabajo con IA, incluyendo una subvención de Google News Initiative para un próximo proyecto de machine learning. A partir de la idea de los comprobadores de seguridad de las contraseñas, la herramienta hará recomendaciones a los periodistas para mejorar la redacción en cuanto a la diversidad y la inclusión.
Un enfoque de género y la parte de negocio
En la experiencia de La Nación, la colaboración interna también puede fomentar el apoyo para el desarrollo de IA dentro de la organización. Y para obtener más recursos. El equipo está trabajando en una versión en español del rastreador de la brecha de género, una herramienta concebida para medir la proporción de fuentes femeninas y masculinas que se citan en artículos de noticias en los medios canadienses. Coelho y su colega Delfina Arambillet comenzaron a trabajar en esto a través del proyecto JournalismAI Collab, organizado por la Escuela de Economía de Londres, y lo han llevado a la redacción de La Nación para comprender mejor el sesgo en el periodismo, incluyendo si el género de una fuente afecta los temas sobre los que es más probable que se la cite. La herramienta será útil para que el equipo de visión de negocio del periódico pueda evaluar cómo el género o los temas que trata afectan al rendimiento de un artículo.
En una extensión del proyecto de seguimiento de género, La Nación además participó en un modelo de IA de fuentes abiertas desarrollado para detectar el género en los rostros, con el fin de ayudar a analizar la proporción de imágenes masculinas y femeninas usadas por los medios de noticias. Al compartir unos 50 retratos argentinos y latinoamericanos con el equipo que entrenó al modelo de IA –originalmente familiarizado con rostros asiáticos– mejorará la capacidad de la IA de detectar un rango más diversas de facciones en cuanto al tono de piel y etnia, lo que lo hará más útil para una variedad más amplia de medios.
Ya sea con las empresas de tecnología, departamentos comerciales, otras redacciones o voluntarios lectores, en los proyectos de IA de La Nación hay un fuerte enfoque en la colaboración. “Las habilidades son tan difíciles de aprender que es mejor aprenderlas juntos, incluso con los competidores. Aprender la habilidad juntos y luego competir por las noticias”, dice Coelho. “Ya competimos con Google y Facebook por la atención de nuestra audiencia. No es bueno que nos tardemos 10 años en aprender estas cosas. Debemos acelerar el proceso de aprendizaje y de participación radical y trabajar con otros países. También habrá que estudiar, pero es mucho para una sola persona”.
Este artículo lo publicó el Instituto Reuters para el Estudio del Periodismo y se vuelve a publicar aquí con su autorización. Forma parte de una serie regular de publicaciones de GIJN sobre Inteligencia Artificial y periodismo de investigación.
Recursos adicionales
Guía para periodistas sobre el uso de IA e imágenes satelitales en la narrativa (Inglés)
Geografía Deepfake: cómo puede falsificar imágenes satelitales la IA (Inglés)
La inteligencia artificial en el periodismo: con el poder vienen también las responsabilidades
Laura Oliver es una periodista independiente que vive en el Reino Unido. Ha escrito para The Guardian, BBC, The Week y más. Es profesora invitada de periodismo online en la City, Universidad de Londres, y trabaja como consultora de estrategia de audiencia para redacciones. Puedes encontrar su trabajo aquí.