Cómo los periodistas de datos revelaron la tasa real de muertes por COVID-19 en Brasil

Print More

Una vista aérea tomada en junio, de las cruces que proyectan sus sombras sobre el cementerio del Parque Taruma, en Manaos, al tiempo que las muertes por COVID-19 siguen aumentando en Brasil. Foto: Bruno Kelly /Reuters.

El periodista de datos Marcelo Soares, con la ayuda de dos ex estudiantes, recogió datos con los que demostró que las muertes por COVID-19, en las ciudades de Brasil, eran mucho más altas de lo que decían las autoridades.

“En marzo, durante los primeros días de la pandemia en Brasil, me intrigaba la ausencia de detalles en los datos del Ministerio de Salud”, dijo Soares. “Solo publicaban cálculos de casos agregados por estado, y había un retraso en comparación con lo que publicaban las secretarías estatales”.

Soares creó gráficos interactivos, entre ellos un mapa de temperatura, con el uso de Datawrapper, Flourish, y Google’s Data Studios, y los publicó junto con sus historias en Brazilian Report.

“Revisé los 27 estados para obtener datos a nivel de ciudades”, dijo Soares. “Los estados tenían formatos distintos para reportar los datos, y los formatos cambiaban a diario, así que resultaba difícil automatizarlo”.

Soares visitó secretarías estatales de salud a diario para recoger los datos reunidos por cada municipalidad, y halló que los datos estatales estaban más actualizados que los federales, pues el ministerio los recogía por teléfono.

“Incluso cuando hay un sistema nacional de notificaciones, que llega directamente a las municipalidades, hay múltiples sistemas paralelos”, dijo Soares.

Los datos llegaron en varios formatos que Soares debió estandarizar para que fuera capaz de analizarlo todo junto.

“Algunos tenían tablas en formato HTML, otros micro datos, otros reportes en PDF, y uno en Amazonas publicó los casos en mensajes de redes sociales”, dijo. “En marzo, me tomaba media hora al día, y valió la pena”.

Para mediados de abril, Soares pasaba tres horas diarias haciendo recolección de datos, y le pidió a Pedro Teixeira y Fabio Freller, dos ex estudiantes del curso de periodismo de datos, que le ayudaran.

“Curiosamente, ambos inicialmente estudiaron ingeniería, y tenían un gusto por la programación antes de trasladarse a estudiar periodismo”, dijo.

Halló que diferentes tipos de categorización generaban un subregistro en las muertes por COVID-19.

“Generalmente, las muertes por COVID-19 se clasifican como muertes por Síndrome Respiratorio Agudo Severo (SRAS), hasta que se confirme por pruebas”, dijo Soares. Una vez cayeron en cuenta de ello, complementaron su investigación con micro datos de SRAS.

Soares ha publicado tablas de la investigación sobre COVID-19 con actualizaciones en vivo en su portal, Lagom Data, que reúne, analiza y visualiza datos de salas de prensa y organizaciones de la sociedad civil.

Una de las herramientas que usó para su análisis de datos fue BigQuery, del DataStudio de Google. Puede encontrar aquí su informe de búsqueda.

“Esta es la herramienta donde recojo mis datos a nivel de ciudad, enriquecidos por metadatos. Por ejemplo, ¿es una capital?, ¿está en el Amazonas?, ¿está en la frontera?, etcétera”, dijo. “Lo hacía en Google Sheets hasta que llegué a 40.000 líneas”.

Pronto, muchos medios de comunicación comenzaron a usar estos datos. Entre ellos Roda Viva, un popular programa semanal de entrevistas en el canal público de São Paulo.

Luego de que lo invitaron para una entrevista en el programa, el tráfico en el portal se disparó, y a finales de abril, Soares introdujo una membresía basada en suscripciones para Lagom Data, con el objetivo de mejorar el portal y pagarles a los estudiantes que le ayudaban.

En los primeros días de junio, el gobierno intentó impedir que publicara los datos, pero la maniobra tuvo el efecto contrario: llamó más la atención sobre su portal y aumentó el número de suscriptores, entre ellos personas con cargos públicos.

Datos que reflejan los casos identificados en el noreste de Brasil. Imagen: Captura de pantalla.

“Uno de estos suscriptores nuevos es un secretario de planeación en el norte de Brasil”, dijo Soares. “Otro es un respetado investigador de salud reproductiva, que salió de Brasil después de ser amenazado por el gobierno”.

Algunos de sus nuevos suscriptores incluso han llegado a depender de los datos de Soares para guiar la reapertura de instituciones públicas.

“Uno de ellos trabaja en la coordinación de un colegio privado en la ciudad de São Paulo, y necesita las series de su ciudad para planear cuándo reabrir”, dijo Soares.

“Me siento muy orgulloso de nuestros suscriptores”, añadió. “Pero no sería posible haberlo hecho sin la ayuda de los estudiantes”.

Cómo lo hicieron

Marcelo Soares

 A Soares le entusiasmó trabajar con Teixeira y Freller.

“Eran estudiantes cuyo trabajo conocía, y era una buena oportunidad para estar en contacto y compartir algunos trucos del oficio”, dijo.  

Su ex profesor primero separó los 27 estados de Brasil y se aseguró de que los grupos estuvieran divididos según su dificultad.

Su medio primario de comunicación era WhatsApp, “que es como nuestra nevera, y una plantilla de Google Sheets que llenaban a diario con el nombre de la ciudad, el estado, el número conocido de casos de COVID-19, y la cuenta de muertes confirmadas de COVID-19”, dijo.

“Si el nombre de la ciudad coincidía con la ortografía oficial, la plantilla arrojaba el código de la ciudad definido por IBGE, nuestra oficina de censos. Con ello, podía emparejar estos datos con otras bases de datos, como la de población (para calcular las tasas por 100.000 habitantes), el PIB per cápita, las características de la ciudad, y así, para enriquecer cada punto de datos con posibilidades de análisis”, añadió. 

“A prinicipios de mayo, el gobierno comenzó a publicar casos por ciudad. Por un tiempo comparamos los resultados y hallamos que eran muy similares a lo que habíamos recogido, así que comenzamos a recoger del gobierno los datos de ciudades, y los estudiantes hicieron otros análisis”, dijo Soares. “Fabio, por ejemplo, trabajó con los micro datos de SRAS, una clasificación que indicaba casos que no tenían una causa conocida. En marzo, un instituto de investigación de salud notó un pico enorme en los casos SRAS, que era mucho más alto que en años anteriores”.

Los estudiantes notaron que los casos SRAS eran muy similares a los de COVID-19, y hallaron que la mayoría de los estados hacían pruebas a casos SRAS, para saber si de hecho eran casos de COVID-19.

“Las muertes COVID-19 por lo general se clasifican como muertes SRAS, hasta que las pruebas lo confirmen”, dijo Soares. “Así que una vez fue más fácil trabajar con otro tipo de datos, Fabio comenzó a usar los microdatos SRAS para ver qué podía elaborar. Construimos una serie de tiempo de SRAS x muertes COVID-19, que llevó a la historia publicada en la Folha de São Paulo“.

Usaron Datawrapper, Flourish, y Google’s Data Studios para el análisis y la visualización. “Son gratis, estéticamente agradables y muy fáciles de usar”, dijo Soares. “Datawrapper y Flourish hacen tablas bonitas. En Flourish podemos hacer las tablas animadas. Los mapas de Datawrapper se actualizan manualmente todos los días y las tablas de barras se actualizan automáticamente. En un principio alimenté con el Google Sheet un mapa de Data Studios, pero se rompió con 100 puntos, y por eso nos pasamos a Datawrapper”.

“Ahora uso Data Studios para hacer el tablero de los datos almacenados en BigQuery. [En el portal de Lagom Data], Máquina do Tempo (Máquina del Tiempo) tiene las series completas de conteos de casos y muertes, tal como fueron reportadas por los estados. Subnotificômetro (Subnotificómetro) mira las muertes de SRAS en comparación con las muertes conocidas de COVID-19 para cada ciudad, día por día”, dijo.

“Inicialmente estuve recogiendo datos en Google Sheets, hasta que se volvió muy grande y tuve que subirla a BigQuery, una herramienta para la que se debe pagar y hace parte de Google Cloud Services. Mantengo muchas bases de datos grandes allí. Entre ellas, contratos formales (una línea para cada contrato formal en Brasil, que sumaron 68 millones de líneas en 2018), y registros de compañías con nombres completos de socios de compañías (28 GB)”.

Habría sido difícil imaginar hace 15 años un proyecto de datos de estas magnitudes.

“Eso era inimaginable aquí en Brasil, donde aprendí a usar Access en 2003, gracias a Brant Houston [Profesor Knight de Periodismo Investigativo y Empresarial], durante los primeros días de Abraji [la Asociación Brasilera de Periodismo Investigativo]. Más que las herramientas y la nube, lo difícil era encontrar datos detallados en Brasil. Todavía tengo el CD de bolsillo en el que Brant puso una porción de los registros de inmigración de Estados Unidos para que los analizáramos en clase, con el fin de observar patrones de migración de Brasil a los Estados Unidos”, dijo Soares.

“En el 2002, para recoger los datos de activos económicos de los candidatos, Folha tuvo que enviar a periodistas a cortes electorales de los 27 estados, y obtener fotocopias de las declaraciones de propiedad de bienes que entregaban quienes querían ser candidatos. Fui parte de eso, y recuerdo que llevaba unas 40 libras de fólderes de registros para cada candidato, para fotocopiarlas en otro lugar, porque la corte no podía cobrar por tantas fotocopias”, dijo Soares. “Cuatro años más tarde, como resultado de ese trabajo y otros que le siguieron, estos registros se pusieron en línea durante cada elección. Seis años más tarde, tenemos la ley de acceso a la información”. 

“Ha habido muchos cambios aquí”, concluyó Soares”. “Generalmente han sido mejoras”.


Este artículo se publicó originalmente en el Investigative Journalism Education Consortium (IJEC), y se publica de nuevo acá con permiso.

Jelter Meers es un coordinador de edición del Organized Crime and Corruption Reporting Project y es miembro de IJEC, un consorcio de educadores universitarios de periodismo, que enseñan periodismo de investigación en el mundo.

Leave a Reply

Your email address will not be published. Required fields are marked *