Consejos sobre dónde obtener datos de la pandemia y las herramientas para analizarlos

Print More

Inglés

Ideas de datos para trabajar el panorama post-COVID-19. Imagen: Universidad de Columbia y CLIP

El crimen organizado está cambiando sus rutas de tráfico bajo la sombra de la pandemia. El comercio de madera contrabandeada en la Amazonía está creciendo en ausencia de supervisión. Las cifras de desempleo y alcoholismo siguen creciendo y no hemos logrado ganarle al cambio climático. 

El mundo está cambiando rápidamente -y prácticamente en todos los niveles-  bajo la sombra de la pandemia, dice Giannina Segnini, la directora del programa de Periodismo de Datos de la Universidad de Columbia (EE.UU.)

Pero hay datos y herramientas disponibles para investigar y analizar estos cambios, y los reporteros pueden rastrear muchos de ellos en tiempo real, incluyendo los cambios en el comportamiento, dice Segnini. 

“Escuchen, tus nietos van a hablar sobre la era pre y post Covid-19. Definitivamente estamos siendo testigos de una situación histórica”, dijo Segnini en un foro virtual del 18 de junio, parte de la serie Investigando la pandemia de GIJN. “Esto está apenas empezando. Están pasando tantas cosas a través de las fronteras que no están siendo monitoreadas. Pero hay datos para monitorear lo que está pasando, y nunca antes los datos han sido una mejor herramienta para dar sentido al mundo que nos rodea.”

Segnini es cofundadora del Centro Latinoamericano de Investigación Periodística (CLIP), y con su colega de CLIP y data scientist, Rigoberto Carvajal, compartieron ideas para encontrar nuevas fuentes de datos para investigar este nuevo mundo. 

Más allá de las amenazas directas a la salud de COVID-19 y sus consecuencias, Segnini dijo que las salas de redacción podrían crear bases de datos que muestren cambios en la vida cotidiana de sus comunidades.

“Usando la integración automatizada de datos y escalas estandarizadas, se pueden imaginar paneles que reflejen cambios en variables como, por ejemplo, multas de tránsito, arrestos, precios de alimentos, desalojos”, dijo. “Todos estos cambios van a suceder de inmediato en la sociedad. Y los malos se están aprovechando del hecho de que todos estamos distraídos por [el] coronavirus. La trata de personas y la corrupción todavía están sucediendo, pero están cambiando rutas y mecanismos. Se están destruyendo las cadenas de suministro. Hay cambios dramáticos en el envío y las aerolíneas, con las restricciones de viaje”.

Aunque los números son ficticios en esta visualización, Segnini dijo que las salas de redacción podrían crear sus propios paneles con datos de la “vida ordinaria” superpuestos en los datos del caso COVID-19 para mostrar su impacto de forma más amplia. Imagen: Universidad de Columbia y CLIP

Segnini previamente fue la directora de la Unidad de investigación de La Nación de Costa Rica, y el trabajo de su equipo llevó al enjuiciamiento de más de 50 figuras públicas, incluidos tres ex presidentes.

En su trabajo anterior, con el Consorcio Internacional de Periodistas de Investigación, Carvajal fue uno de los expertos en data la investigación de los Panamá Papers. 

Carvajal dijo que los datos de casos de COVID-19 proporcionados por los gobiernos iban desde números brutos y paneles básicos hasta datos agregados descargables, la forma más común, pasando por la mejor forma, pero la más rara: datos granulares, caso por caso. En América Latina, dijo, México, Colombia y Perú se destacan como países que ofrecen las bases de datos más ricas.

“La mejor manera de obtener una rica visualización del conocimiento de los conjuntos de datos es extraer datos granulares, con registros individuales [anónimos] para cada paciente [caso]”, dijo Carvajal.

Dijo que era importante utilizar programas “ETL” (extraer, transformar, cargar, en sus siglas en inglés) para importar automáticamente esos datos en paneles o visualizaciones debido a su gran volumen. Él utiliza una herramienta de código abierto, Talend Open Studio, para la integración de datos.

Sin embargo, dado que los datos de COVID-19 aún no son confiables en muchos países, Segnini dijo que extraer los datos de exceso de mortalidad siguen siendo una técnica poderosa para mostrar de manera más amplia los impactos de la pandemia.

“Ya sea que tengas datos granulares o agregados, sabemos que no se cuentan todos los casos, porque muchos mueren en el hogar, o no fueron evaluados y los lineamientos solo [señalan] a personas con resultados positivos, o porque los sistemas de informes son inadecuados o imprecisos “, dijo. “Muchos tienen miedo de ir al hospital, y podrían haber muerto porque tuvieron complicaciones. Existe una metodología que permite calcular este exceso de mortalidad. Debes tener datos sobre todas las muertes anteriores durante el mismo período de tiempo en años anteriores. Puedes representarlo usando números absolutos o como un porcentaje. Cuantos más años anteriores tengas, mejor será el cálculo”.

Dijo que la aparición de datos de movilidad -donde las señales personales de los teléfonos móviles se pueden anonimizar y agregar- representa una nueva herramienta poderosa para describir un cambio rápido.

Herramientas recomendadas por Carvajal y Segnini

Imagen: Universidad de Columbia y el CLIP


Rowan Philp es un periodista de GIJN. Rowan fue el reportero principal para el Sunday Times, de Sudáfrica. Como corresponsal extranjero, hizo reportajes de noticias, política, corrupción y conflicto en más de dos docenas de países del mundo.

Leave a Reply

Your email address will not be published. Required fields are marked *