Una de mis herramientas favoritas para la gestión de documentos es DocumentCloud; algunas de sus funciones incluyen la posibilidad de convertir documentos PDF a texto y crear estadísticas de los archivos que has subido. Pero, ¿qué sucede si necesitas analizar cientos, o incluso miles, de documentos? En tal caso, es probable que prefieras Overview, una herramienta de manejo de documentos creada con el periodismo investigativo en mente.
Overview puede importar documentos desde varias fuentes —incluyendo DocumentCloud— y te permite manejar desde docenas hasta millones de páginas. Puedes visualizar los datos que existen en una colección de documentos de distintas formas, como nubes de palabras o gráficos de red. También ofrece una gama de herramientas de búsqueda que hacen relativamente sencillo filtrar tus datos para encontrar información específica. Una de sus mejores funciones es la posibilidad de agrupar automáticamente tus documentos en carpetas de acuerdo con su contenido. Además, como DocumentCloud incluye reconocimiento óptico de caracteres (ROC) puedes visualizarlos en su formato original o como texto simple. También puedes agregar notas y etiquetas. De esta manera, manejar miles de documentos ya no es tan abrumador.
¿Quién lo tuiteó?
Twitter puede ser una gran fuente de información para periodistas, pero investigar conversaciones de manera efectiva es bastante difícil a menos de que tengas conocimientos de programación y sepas utilizar el API de Twitter. Uno de mis descubrimientos favoritos, sin embargo, facilita mucho este trabajo. Treeverse es una extensión de Chrome que te permite encontrar a los participantes de un hilo de Twitter con solo hacer click en el tuit.
Treeverse puede descargarse desde la App Store de Chrome. Una vez instalada, abres Twitter, encuentras un hilo activo y seleccionas el tuit original; con el tuit abierto, haces click en el icono de la extensión de Treeverse y te presenta un diagrama de árbol con los participantes de la conversación. Selecciona un usuario y su tuit aparece en la barra lateral con los tuits anteriores al suyo. Cada hilo está identificado con un color diferente basado en cuándo fueron publicados. Esto te ayuda a ver mejor la información.
Extraer información de Twitter
Hablando de Twitter, una de las mejores herramientas para extraer información de sus usuarios es FollowerWonk, que tiene una amplia gama de funciones para analizarlos. Por ejemplo, podrías comparar varios perfiles: su actividad en la página, las coincidencias entre las cuentas que siguen y sus seguidores en común. Una de las características más útiles de FollowerWonk es la opción de encontrar perfiles por medio de sus biografías de Twitter. Esto es especialmente útil para encontrar a usuarios de alguna industria o expertos en un tema en particular.
No más lágrimas
En la mayoría de los proyectos de investigación llegas a un punto en el que necesitas compartir documentos con tus colaboradores o fuentes. Por supuesto, existen docenas de servicios web como Dropbox y Google Drive que se pueden utilizar y un correo electrónico funciona en la mayoría de los casos. Pero, ¿qué pasa si un documento es delicado y no quieres arriesgarte a que sea interceptado?, ¿o si necesitas compartirlo de manera anónima? Una de las herramientas más sencillas de utilizar en estos casos es OnionShare.
OnionShare es un software de código abierto y funciona con la mayoría de los sistemas operativos, incluyendo Windows, Mac OS y Linux. Una vez instalado, el usuario puede arrastrar y soltar archivos en OnionShare. Cuando comienzan a compartir los archivos, OnionShare crea un servidor Tor protegido y genera una URL. El destinatario abre la URL utilizando el explorador Tor —seguro y anónimo— para descargar los archivos.
Por defecto, OnionShare cierra la conexión en cuanto termina la descarga, así que los archivos no permanecen en línea donde alguien más podría encontrarlos.
Un paso más
Si lo que necesitas es algo más permanente que OnionShare, entonces debes considerar instalar una Virtual Private Network (VPN). Los VPNs son útiles para proteger la comunicación dentro de una organización, pero tienen la reputación de ser caros y difíciles de instalar: Outline es una excepción.
Outline, creado por Jigsaw, simplifica el proceso de instalar un VPN utilizando servicios como DigitalOcean, que cuestan apenas unos cuantos dólares al mes. Outline incluye una herramienta de control para instalar el número de VPNs que quieras, así como un cliente utilizado para accesar a tu nuevo VPN.
Siempre vigilantes
Existen muchas razones por las que podrías querer monitorear cualquier cambio en un sitio web. Tal vez necesites ver las alteraciones realizadas a un perfil, una lista, una página de regulaciones o el portal de una corporación. En lugar de abrir el sitio cada mañana para buscar qué hay distinto puedes hacer tu vida más fácil con una herramienta de monitoreo. Existen varios monitores de páginas web disponibles y yo, personalmente, prefiero Versionista y VisualPing. Ambas son fáciles de utilizar: solo debes dar la URL que te interesa y tu correo electrónico. El servicio te enviará una alerta al correo en cuanto detecte algún cambio en la página web. Los dos servicios también guardan versiones del sitio que estás vigilando, por lo que puedes ver la evolución de la página con el paso del tiempo. Así mismo, ofrecen un servicio básico gratuito y una versión más avanzada de pago.
¿Tienes alguna herramienta o tip que valga la pena compartir? Envíame un correo electrónico a alastair.otter@gijn.org
Alastair Otter es el coordinador de IT de GIJN. Ha trabajado en múltiples proyectos de periodismo de datos en Sudáfrica y se especializa en la programación interactiva de visualización de datos.