Dos piezas importantes de carácter investigativo del 2020, y con uso de bases de datos, son Los explotadores del agua y Chavismo Inc. Ambas investigaciones ilustran que ya sea por medio de una base de datos pública, o cuando se comienza una base de datos desde cero, el trabajo valdrá la pena, ya que la investigación presentará hallazgos reveladores.
El manejo de una gran cantidad de información, en ambos casos, fue un reto no solo al momento de procesar, sino también para presentar a las audiencias. Sin embargo, en la última edición del 2020 de las #CharlasGIJN, los reporteros detrás de estas investigaciones explicaron qué herramientas usaron para las distintas fases de la investigación y cómo lograron sólidos trabajos periodísticos, atractivos para sus audiencias, haciendo periodismo de datos.
Las bases de datos son engranajes necesarios del trabajo incisivo de creación, edición y análisis del periodismo de datos.
La periodista mexicana Thelma Gómez Durán fue la coordinadora de Los explotadores del agua, un trabajo reporteado en 2019 y publicado en Mexicanos contra la corrupción, a principios de año.
La investigación partió de la base de datos del registro de concesiones de agua que hay en México, obtenida a través de las vías legales de acceso a la información pública. Un equipo de más de veinte personas se dio a la tarea de ir tras la pista de quiénes eran las personas y las empresas que, finalmente, son dueños del agua en México. Para lograrlo tuvieron que clasificar la información por estado y empezar nuevas bases de datos de cada uno de los 32 estados del país, así revelaron la red de concesiones existente y establecieron patrones para saber a través de qué mecanismos se conseguían esas concesiones. Esto los llevó a develar, incluso, la existencia de un mercado negro de concesiones del agua, un mercado “muy pujante” en los estados con menos volumen de agua.
Desde Panamá, la periodista Sol Lauría, coordinadora de Chavismo Inc, explica que la investigación tenía el objetivo de rastrear los fondos que se exportaron en los últimos 20 años del gobierno chavista en Venezuela. El proyecto de Transparencia Venezolana, Alianza Rebelde Investiga y Connectas, se dividió en dos fases: la primera intentó reconstruir una base de datos de los fondos públicos que salieron del país, y la segunda contar más de sus hallazgos a través de diez historias en varios países.
En Chavismo Inc se identificaron tres patrones: el primero relacionado a la fuga de capitales a través de Panamá, España y Estados Unidos, encabezada por individuos que ingresaban a los países como inversionistas inmobiliarios; en segundo lugar el sistema off shore que les habilitó a esconder o perder dinero de las autoridades con el modelo “Panamá Papers” y, el tercero, en países como Argentina y El Salvador, las alianzas con los gobiernos de turno que le permitieron lograr fideicomisos y otras formas de “intercambio” comercial.
Depurar, reconstruir y analizar las bases de datos
A veces iniciar, después modelar, depurar, reconstruir y analizar las bases de datos no es una labor sencilla. Daniel Gómez Hernández, parte del equipo de Los explotadores del agua, cuenta que la base de datos que ellos utilizaron contenía más de medio millón de registros y venía con innumerables defectos: desde las coordenadas en los mapas erradas, hasta nombres de empresas y personas disparejos. Esto hacía muy difícil ver cuántas concesiones estaban ligadas a un solo nombre. Allí empezó “el trabajo de hormiguita”: igualar cada nombre y cerciorarse de que toda la información estuviera en orden para poder analizarla. “La base de datos, más que en la planificación, tiene un papel fundamental en el desarrollo. En este trabajo fue muy importante mantener la comunicación constante con las investigadoras mientras iba realizando el análisis de la base de datos”.
Entre investigadoras y analista realizaron sesiones de preguntas para ir resolviendo en la base y hubo también un ciclo de validación: “Si yo encontraba hallazgos en las bases, ellas validaban en campo que eso hubiera pasado, o al revés, ellas encontraban zonas con acaparamiento y yo iba a la base a ver qué arrojaba”.
Es importante tener en cuenta que existen herramientas tecnológicas que facilitan el trabajo de quienes procesan bases, advierte Iván Ruiz, moderador del seminario web y editor de Connectas. Por ejemplo, para el análisis de datos de Los explotadores del agua se usó Python, en particular la librería pandas. Para la visualización se usó Mathematica para hacer algunos borradores y finalmente la librería de javascript D3 para visualizar en web.
Sobre esta fase Sol Lauría añade que a veces quienes piensan en periodismo de datos creen que quienes trabajan en eso están “rodeados de robots” o que hacen magia pero la realidad es otra: “las bases cuestan un montón (…) es mucho renegar, se sufre, no es algo que se sale fácil y tarda mucho tiempo chequear cada dato”.
¿Cómo se elige qué mostrar y visualizar?
“Cuando hay tanta información, ¿qué se toma como prioridad?, ¿cómo se elige qué visualizar? y ¿qué no?”, son preguntas que hace Iván para reflexionar sobre otro aspecto clave: visualización de datos. Contesta Rocío Arias, de Los explotadores del agua, y dice que lo fundamental es ponerse en los zapatos del ciudadano que te va a leer.
“Hay que cuestionarnos qué es lo que quisiera saber un ciudadano (en este caso) acerca del uso que se le da al agua”. Saber que no vas a poder mostrar toda la información en una sola visualización, te da cierto margen para empezar el proceso de priorizar. En ese proceso, las investigadoras están muy vinculadas pues es las que finalmente conocen las implicaciones de esos datos.
Otro aspecto importante es el orden de las visualizaciones. Siempre hay que tener en cuenta que “estamos poco a poco explicando un tema y con cada visualización se le va dando contexto para llegar a conclusiones interesantes”. Dos herramientas para visualizar recomendadas en la charla fueron: rawgraphs.io y datawrapper.de.
Una innovadora incorporación durante la investigación mexicana fue el uso de fotos y videos realizados por drones que permitieron mostrar un mapa con las coordenadas de dónde estaban las concesiones del agua. “Para nosotros era vital mostrar eso del agua”, explica Thelma.
En un país donde el control de territorios en ocasiones está en manos del crimen organizado o donde simplemente es difícil acceder a ciertas propiedades privadas, el dron se volvió un aliado. En este caso permitiendo tomar imágenes de lo que reflejaba la información obtenida, pero también mostrando nuevos hallazagos. En el caso de esta investigación, dice Thelma, los compañeros que manejaron los drones se volvieron “especialistas en identificar pozos ilegales”, pues fueron numerosas horas de grabación y captura de imagen para lograr las conclusivas.
Información libre
Un aspecto llamativo de Chavismo Inc, es el hecho de dejar la información recabada para el acceso público, cosa que no es tan común cuando hablamos de bases de datos enmarcadas en investigaciones periodísticas.
María Fernanda Sojo, una de las investigadoras venezolanas que participó en el trabajo, explica que en Venezuela el acceso a la información pública es difícil, y quienes realizan periodismo de investigación allí se han vuelto expertos en reinventar formas para acceder a los datos.
“Ante esta dificultad, nosotros quisimos ir en contra de esto. Poder poner a la mano esta información, todo el trabajo que significó poner esta información a la luz pública (…) es un trabajo de mucho tiempo, que una vez que ya estaba hecho no nos lo queríamos quedar nosotros”.
El equipo espera que la investigación no se quede solamente en esas diez historias, sino que cualquier periodista de investigación que lo desee, use la base de datos como insumo para proyectos que se quieran hacer de aquí en adelante, y seguir visibilizando la fuga de capitales venezolanos.
Para finalizar, un aspecto importante que Sol Lauría destaca para cualquier investigación en la que participan muchas personas: “la clave es la organización”. Siempre tener en cuenta los acuerdos, la confianza mutua entre participantes y, durante una pandemia, pues ser compresivos y adaptarse. “Van a pasar cosas todo el tiempo, pero si algo no se conversa, queda un hueco. Si no se habla, siempre van a tener problemas”.
Para Los explotadores de agua, participaron cerca de veinte periodistas, y en el caso de Chavismo Inc, diez localizados en los países involucrados.
Lecturas recomendadas
Nuestra selección de historias de investigación de América Latina – 2020
Cómo ser (y tener éxito) como periodista freelance durante la pandemia
María Laura Chang es una periodista independiente venezolana que vive en Buenos Aires. Se especializa en temáticas sociales como los derechos humanos, salud sexual y reproductiva y migración. Actualmente forma parte del equipo de comunicación de Chicas Poderosas y le interesa impulsar investigaciones trasnacionales y colaborativas. Ha publicado artículos en The New York Times en español, News Deeply, Salud con Lupa, RedAcción, Armando.Info, La vida de nos, Efecto Cocuyo, entre otros. En 2019 ganó la Beca Oxfam / Fundación Gabo de Periodismo Migratorio. También fue dos veces finalista en los Premios Gabriel García Márquez.