Para la serie de GIJN “Mis herramientas favoritas“, esta semana hablamos con Bárbara Maseda, la fundadora y editora del Proyecto Inventario, una plataforma de datos abierta para los periodistas que informan sobre su Cuba natal.
El acceso a internet limitado y la falta de transparencia en el país hace muy difícil – y a veces imposible – para los periodistas encontrar hasta los datos más básicos para sus reportajes. Maseda, que estudió periodismo en la Universidad de La Habana, ha estado investigando los enfoques cuantitativos de las noticias durante varios años, un trabajo que hizo también en la Universidad de la Ciudad de Birmingham en el Reino Unido.
En 2018, durante su año en la Universidad de Stanford como becaria del programa para periodistas John S. Knight fundó el Proyecto Inventario, cuyo objetivo es proporcionar a los periodistas independientes un fácil acceso a los datos y documentos sobre todos los aspectos de la vida en Cuba.
Desde que comenzó el brote de coronavirus, el Proyecto Inventario se ha convertido en una fuente esencial de datos sobre la propagación del virus en la isla. Maseda ha estado convirtiendo la información sobre los casos en una base de datos estructurada y desglosada por fecha, geografía y características de los pacientes. Las visualizaciones del Proyecto Inventario, utilizando la plataforma Flourish, han sido utilizadas por varios medios de comunicación independientes cubanos.
En 2019, Proyecto Inventario ganó el Premio de Datos Abiertos en los Premios de Periodismo de Datos y Maseda ha sido elegida recientemente como becaria de TED 2020. Ella misma dirige el Proyecto Inventario y maneja desde las redes sociales hasta las respuestas a solicitudes de los periodistas que consultan la información en su portal. Planea seguir construyendo la iniciativa a través de esquemas de financiación colectiva y subvenciones.
Aquí están algunas de las herramientas de investigación favoritas de Maseda, y cómo las utiliza para superar las dificultades de la información en y sobre Cuba:
Klaxon
“De las muchas opciones que existen para automatizar la detección de cambios en los sitios web, en Proyecto Inventario utilizamos Klaxon, una herramienta creada por The Marshall Project. Klaxon es muy conveniente, porque monitorea muchos sitios y partes diferentes de las páginas web. Por lo tanto, el nivel de personalización y detalle que ofrece, permite centrarnos en elementos muy específicos. Funciona muy bien para nosotros.
Esto es muy útil en el periodismo en general, pero particularmente en Cuba, donde la mayoría de los sitios web oficiales no ofrecen un servicio de suscripción para las personas interesadas en saber si hay nueva información o datos disponibles. Además, el periodismo independiente no es legal en Cuba, por lo que nuestra relación como reporteros con los enlaces de los medios de comunicación en las instituciones oficiales es prácticamente inexistente. Por lo tanto, automatizar la detección de cambios en el sitio web es ciertamente una de nuestras mejores oportunidades para aprender, lo más rápido posible, que nueva información oficial ha sido publicada.
“Por ejemplo, uno de los sitios web que monitoreamos es el depositario oficial de la ley cubana, la Gaceta Oficial. Gracias a Klaxon, se nos notifica en una hora que se ha publicado una nueva regulación, y utilizamos esa información para alertar a los periodistas y editores que sabemos que están trabajando en historias o cubriendo un tema para el que la nueva regulación podría ser relevante.
Otra forma en la que hemos usado Klaxon es como un imperfecto, pero efectivo, sustituto de un extractor de datos que necesita funcionar periódicamente en la nube. Si no tienes las habilidades o el tiempo para montar tu propio extractor, puedes usar Klaxon para recolectar y almacenar tablas o listas, o cualquier otra fuente de datos de un sitio web determinado a medida que se actualizan”.
Sublime Text
“Me encanta cómo el Sublime Text puede ser utilizado para crear una especie de motor de búsqueda local en tu computadora. Si tienes cientos o miles de documentos almacenados localmente como archivos de texto, puedes usar este poderoso editor de texto para encontrar coincidencias que te ayudarán a centrarte en los archivos más relevantes para tu investigación. Puedes leer el maravilloso tutorial de Friedrich Lindenberg, “A Poor Journalists’s Text Mining Toolkit”, si quiere aprender a usarlo.
Como periodista de un país donde no hay mucha información en línea, dependemos mucho de los archivos de documentos que cambian de manos en memorias flash, así que esta es una herramienta muy útil. Diría que es útil incluso en los casos en que la información está en línea, pero en formatos que no son óptimos para los usuarios y los motores de búsqueda.
El repositorio de leyes cubano, para volver a usar el mismo ejemplo, durante mucho tiempo publicó nuevas regulaciones como archivos PDF que fueron comprimidos como archivos .RAR. En casos como éste, una buena solución es descargar todo el sitio web, convertir todo a formatos de archivo más convenientes y organizar la información de manera que facilite la búsqueda de los periodistas”.
Wayback Machine
“Todos aman la Wayback Machine, y por supuesto nosotros también. En un país donde el registro público es muy deficiente, y en donde páginas web e incluso sitios web enteros no están disponibles todo el tiempo, tener un recurso como la Wayback Machine para comprobar las versiones antiguas es extremadamente valioso.
Uno de los problemas que enfrentamos cuando se trata de la integridad de los datos es que a veces algunas instituciones gubernamentales borran los registros y/o entradas antiguas cuando publican nuevas versiones de un determinado conjunto de datos. Por ejemplo, la versión más reciente del registro de cooperativas no agrícolas no incluye ninguna de las empresas que han sido eliminadas del registro. Utilizamos la Wayback Machine para obtener todas las versiones anteriores de ese registro y volvimos a incluir todas las cooperativas inactivas o extinguidas en un conjunto de datos que está disponible para los reporteros, y cualquier otra persona interesada en consultarlo.
“The Wayback Machine can also be a great neutral third party to make copies of websites that you fear might disappear, or be altered, and that are key to your investigation. When we built a data set of all the flights that Cuban doctors took from Brazil back to Cuba in late 2018, following the cancellation of the Mais medicos program. We made sure that the news reports from which we took the figures of the medical personnel traveling in each flight were stored in the Wayback Machine. This is an important measure to take when you are a journalist who covers a government that likes to discredit critical coverage and question journalists’ commitment to truth.”
Videos de calle
“No es una herramienta en sentido estricto, pero es una idea que podría ser útil para los reporteros en países donde no hay Google Street View, como Cuba. Ante la imposibilidad de usar Google Street View como herramienta de geolocalización para la OSINT como lo hace la gente en otros países, hemos encontrado una alternativa en la cantidad de videos de las calles y barrios cubanos que la gente publica en las plataformas de medios sociales como YouTube, Facebook, Twitter, y otros. Típicamente, estos son videos grabados por cubanos que viven en el extranjero que van a visitar a sus familias y les gusta capturar estas escenas nostálgicas y sin editar de su antiguo barrio, o la ruta que tomarían para ir a trabajar”.
DocumentCloud
“Una gran parte del trabajo que hacemos en el Proyecto Inventario consiste en estructurar la información contenida en los documentos, por lo que el hecho de que DocumentCloud ponga en un solo lugar herramientas que nos permiten gestionar pasos clave del procesamiento de documentos, desde el OCR hasta la extracción de entidades, facilita nuestro trabajo.
Pero además de todas las características que estoy segura de que la mayoría de los periodistas aprecian de DocumentCloud, también me gusta que me da acceso a documentos compartidos por otros usuarios donde a veces puedo encontrar información sobre mi país. Buscar en estos documentos públicos es una gran manera de encontrar detalles sobre Cuba que probablemente eran muy secundarios, o incluso nada relevantes, para la investigación realizada por la redacción o el reportero que compartía los documentos, pero eso puede ser, por supuesto, muy importante para mí”.
Kumu.io
“Visualizar las conexiones que hay en las redes sociales, las estructuras de las empresas, y crear árboles de vínculos familiares son algunas de las tareas comunes que Kumu.io hace muy fácil a diario. Hacemos muchos análisis de las redes sociales, y es conveniente que los mapas de la red de Kumu.io puedan ser fácilmente incrustados simplemente actualizando el documento público de Google Sheet que contiene los datos detrás del mapa, si ese es el tipo de fuente de datos que se selecciona de las opciones disponibles”.
Esta historia ha sido actualizada. En la versión previa, señalábamos erróneamente que Proyecto Inventario era el ganador de los Data Journalism Awards de 2019 en la introducción.
Kristina Puga es una periodista de Nueva York. Escribe para NBCNews.com, centrándose en la comunidad latina de los Estados Unidos. También ha creado un sitio llamado WiserWithAge.com en el que escribe sobre personas inspiradoras de 60 años en adelante, con el fin de transmitir su sabiduría a las generaciones más jóvenes.