Los medios de comunicación no necesitan contar con un gran presupuesto para analizar datos: hoy es posible acceder a herramientas básicas gratis o económicas. A continuación encontrarán un resumen de una capacitación de cinco días en Delo, el periódico líder de Eslovenia. Anuška Delić, la periodista que está a cargo del proyecto DeloData, decidió empezar con este entrenamiento con el objetivo de que su equipo pueda realizar periodismo de datos con herramientas accesibles y mucha información.
“En un principio parecía que no a todos los once participantes -que tenían poca experiencia o ninguna con este atrapante campo periodístico -, les iba a ‘picar el bichito’ del periodismo de datos, pero enseguida esto cambió”, recordó Delić.
Introdución a las Herramientas de Datos
Además de mostrar cómo funcionan las búsquedas básicas en Internet (ver más abajo), Excel avanzado, Google Fusion, OpenRefine y Helium Scraper -algo que también incluí en talleres en la European Data Journalism Conference (Data Harvest)-, brindé capacitación en extracción de datos en PDFs con CometDocs, DocumentCloud, Datawrapper y CartoDB.
Resultó que existe buenos datos en Eslovenia que se pueden usar para artículos, por ejemplo en la oficina de estadísticas. Esos datos se pueden organizar según municipalidad, algo similar en muchos otros países europeos.
Consejos para Búsquedas en Internet
Paul Myers researchclinic
Henk van Ess sobre Facebooksearch
Findmyfacebookid
Herramientas de Google
Verificación en dos pasos
Google Offline
Table Capture para Chrome
Importar PDFs
Realizamos extracción de datos en PDFs con CometDocs y OnlineOCR.net. Aquí también pueden ver un repaso de buenas herramientas para importar PDFs. CometDocs sirve para resolver la mayoría de los problemas al extraer datos de PDFs ya que también reconoce caracteres en otros abecedarios. Esta herramienta es gratis para miembros del Investigative Reporters and Editors (IRE).
DocumentCloud
DocumentCloud es gratis y es una buena opción para insertar notas en un documento, y darle la oportunidad a los lectores de chequear un documento completo.
OpenRefine
OpenRefine (antes Google Refine) es una poderosa herramienta gratuita para trabajar con datos desorganizados, limpiarlos y transformarlos de un formato a otro. Aquí encontrarán un buen tutorial al respecto.
Helium Scraper
La versión básica de Helium Scraper, que cumple con su trabajo, cuesta US$100. Creo que es la manera más sencilla de comenzar a ‘scrapear’ datos, pero sólo funciona en PCs y no en Mac.
Google Fusion
Google Fusion es una gran alternativa para realizar mapas, que en la mayoría de los casos se puede usar de forma gratuita. Vale la pena tratar de encontrar una buena versión de mapas de regiones en tu país e importarlos a un mapa estándar en Google Fusion. A continuación, algunos links para poder trabajar con Fusion:
Búsqueda de fusion tables
Tu Google drive
Lista de íconos
http://www.diva-gis.org/
Convertir shape-files
http://www.december.com/html/spec/colorsafe.html
http://colorbrewer2.org/
Layer Builder
Data Wrapper
Data Wrapper es una herramienta muy sencilla para realizar buenos gráficos interactivos, pero para insertarlos desde el server de la empresa es necesario pagar.
En su lugar, los puedes ejecutar desde tu propio servidor y usar WinSCP como sistema para transferir los archivos. WinSCP es gratis y funciona en PCs, pero no en Mac.
El servidor también se puede usar para mapas creados con Google Fusion, pero recuerda estructurar tus drives.
CartoDB
CartoDB es una gran alternativa a Google Fusion que brinda muchas posibilidades para crear mapas de formas nuevas.
En la versión gratuita es posible subir un número ilimitado de mapas y cuadros, aunque el límite total de datos es de 50 MB (en general esto es suficiente). Hay un acceso limitado para geocoding, lo que entonces hay que hacer con otra herramienta. O, en su defecto, la redacción necesita al menos una cuenta paga.
TimelineJS
TimelineJS es una herramienta gratuita de código abierto que permite a los usuarios construir líneas de tiempo interactivas y visuales. Está disponible en 40 idiomas y se puede agregar contenido de forma fácil en una hoja de cálculo de Google y después importarlo a TimelineJS.
¡Mucha suerte con la búsqueda!
Nils Mulvad es cofundador y miembro del board de la Global Investigative Journalism Network, así como de Investigative Reporting Denmark. También es editor en Kaas & Mulvad, una consultora especializada en periodismo de datos, y profesor en la Danish School of Media and Journalism. De 2001 a 2006 se desempeñó como CEO del Danish International Center for Analytical Reporting 2001-2006 y fue elegido periodista europeo del año en 2006.