Seis pasos para que las redacciones preserven sus archivos digitales

Print More
Digital news archiving

Imagen: Shutterstock.

Nota del editor: Un equipo de investigadores de la Escuela de Leyes de Harvard estudió recientemente los 2.3 millones de enlaces que aparecían en el sitio web de The New York Times entre 1996 y 2019. Descubrieron que un cuarto de las fuentes enlazadas ahora son inaccesibles y más de la mitad (53%) de todos los artículos que contenían enlaces sufrieron de al menos un caso de “enlace roto”. Problemas como estos enfatizan la necesidad de reportajes como “El estado de preservación de las noticias digitales”, del Instituto de Periodismo Donald W. Reynolds que citamos a continuación.

No es una noticia nueva que las redacciones están sufriendo para sobrevivir, golpeadas por varias fuerzas económicas, la competencia digital y la tecnología, la tormenta de ataques políticos y, en 2020, las repercusiones repentinas de un depredador pandémico.

Aunque estas causas son conocidas en la industria del periodismo, una víctima de la lucha por la supervivencia de las redacciones poco reconocida y que no figura mucho es el impacto sobre un recurso irremplazable del que dependen los ciudadanos de todo el mundo: el registro público de sus comunidades según lo documentado por su periódico, radio, televisora, redacción en línea u otros medios de noticias locales.

¿Qué pasa si ese registro se desaparece? ¿Qué pasa si partes significativas de ese hilo de información, especialmente el contenido digital, se pierde, es decir, se lo come la maquinaria tecnológica descuidada? ¿Qué pasa si, debido a la increíble complejidad de los sistemas de publicación digital, nuestro primer boceto de la historia se está disolviendo?

Esa es la desafortunada realidad de lo que está ocurriendo ahora en las redacciones de todo el país. Silenciosamente, en el fondo de las dificultades públicas de la industria de noticias hay un descenso casi invisible, pero dramático, en los esfuerzos para preservar nuestras noticias diarias.

Como deja claro el nuevo artículo del Instituto de Periodismo Donald W. Reynolds “El estado de la preservación de las noticias digitales”, hay varios pasos que puede tomar cualquier redacción ahora mismo, sin inversión financiera, para abordar el problema de la preservación de las noticias digitales. Comenzar ahora es el mejor camino para resolver estos problemas.

Estos son los consejos de los investigadores sobre lo que puede hacer ahora mismo tu redacción.

  1.  Crear una política de preservación, reemplazar la casualidad

Recomendamos que todas las redacciones implementen una política escrita para la preservación de los artículos. No tiene que ser un documento largo, una página o dos son suficientes para comenzar. Describe las metas de la política, incluyendo el contenido que quieres preservar, para quién se preserva el contenido, y con qué fines esperas que sea utilizado (investigación interna de noticias, por ejemplo). Cuando esté establecido eso, es posible que quieras [también] especificar otros formatos de archivo, quién debería tener acceso y directrices sobre qué tipos de cambios se pueden hacer después de que el contenido se publica, quién puede hacerlos, y qué permisos necesita, si es el caso. Por ejemplo, debes incluir tu política sobre noticias “despublicadas” (consultar más de este término abajo) ya que esto puede afectar directamente tu contenido guardado.

También puedes implicar a distinto personal, especialmente al de tecnología, junto con quienes desarrollen nuevas oportunidades de mercado para los archivos de contenido mejorado. En cuanto a la tecnología, nuestra investigación muestra que tener una política escrita es un paso importante en el proceso de preservación. Si tu redacción es como la mayoría de las que hemos entrevistado, probablemente no tienen directrices de preservación que seguir y las agradecerían. Al hacer esto, es importante comunicar tu política a todos en la organización y constituir un mecanismo para actualizar y volver a comunicar cualquier cambio a medida que se desarrolla y mejora con el tiempo.

  1.  Asignar a una persona responsable de la preservación

Es importante asignar a alguien de la redacción para que comience a llevar la responsabilidad de la preservación del contenido. Lo más probable es que tu redacción ya no tenga a un bibliotecario de noticias, o quizás nunca lo tuvo. Comienza el proceso ahora asignando a alguien la responsabilidad de comenzar el proceso para garantizar la preservación de tu contenido de noticias digitales a largo plazo. Incluso si esto es solo parte de su rol para comenzar, no esperes. Es un camino largo que tomará muchos meses, si no años, pero este paso es un requisito esencial. No sucederán grandes cambios a menos que haya alguien que se haga responsable del proceso.

Lo ideal sería contratar a archivistas de medios para este trabajo, quienes pueden ayudar a crear planes de preservación de contenido para las noticias digitales, gestionar los metadatos y el proceso de trabajo, y mucho más. Nuestro estudio muestra que, a las organizaciones con personal dedicado a la tarea de preservar los archivos, incluso medio tiempo, les está yendo mejor al preservar contenido de noticias digitales.

  1.  Revisar los metadatos para garantizar que tienes lo que se necesita

Conocer y comprender tus metadatos es un paso crucial para mejorar la preservación de tu contenido único y original. Una revisión mostrará qué pasos puedes dar para asegurarte de tener metadatos claros sobre los objetos del contenido, incluyendo origen y propiedad. Esto puede conllevar a hacer cambios en tus procesos actuales, especialmente cambios en la configuración para agregar o modificar campos de metadatos necesarios para cada tipo de contenido.

Por ejemplo, una tendencia que notamos es que las funciones de asignación de contenidos de noticias comúnmente se hacen fuera de la plataforma, no en un CMS (sistema de gestión de contenidos), sino en herramientas como Google Docs o Google Sheets, donde se sobrescriben o eliminan con el tiempo. Pero esta información es una mina de oro para la preservación porque muestra las intenciones, la planificación de noticias que ayuda a identificar el propósito, hora y fecha, y las personas involucradas en la creación de ese artículo, foto o video.

Si es posible, trabaja con tus proveedores de tecnología para encontrar una manera de ingresar esa información en los campos de metadatos de tu contenido, para que siempre esté allí, ayudando a asegurar que sepas de dónde salió esa fotografía o video, cuándo se tomó, quién la hizo, y cuál fue la historia que generó ese encargo. Esta es información invaluable que la mayoría de las redacciones no aprovecha. Y, si es posible, asegúrate de hacer esto también con datos que no estén en tus sistemas de producción o publicación: las tomas descartadas de la fotografía, el video en bruto original, y los archivos de audio. Este paso puede contribuir considerablemente para garantizar que conozcas la historia detrás del contenido que se ha guardado a lo largo del tiempo.

Como parte de esto, comprueba que tu CMS usa uno de los estándares más comunes para metadatos en la industria: los metadatos IPTC para fotos y videos que crean las cámaras desde el momento en que se capturan las imágenes, incluyendo marcas de fecha y hora y datos de geolocalización. Usualmente, los campos de IPTC se complementan con pies de foto y otra información a medida que los datos de la imagen pasan por el proceso para redactar noticias de edición y maquetación antes de publicar.

Pero también aprendimos que algunos sistemas de CMS web no leen los campos IPTC cuando se importan, o aceptan solo una fracción de lo que está allí. Si ese es tu único sistema, puede ser que tu archivo de fotografía primario no tenga metadatos cruciales. Está bien si estos datos se excluyen al hacer el render del HTML para la página web pública, pero dedica tiempo a comprender este proceso en tu redacción, para asegurarte que en algún punto se almacenarán los archivos de imagen con todos los metadatos.

  1.  Establece un plan para gestionar solicitudes de “despublicación”

Considera los planes de tu redacción para gestionar las solicitudes de eliminación o de modificación de contenido publicado, un proceso que a veces se llama “despublicar” noticias. Con las crecientes preocupaciones sobre la privacidad en internet, la proliferación de servicios de gestión de la reputación, y las restricciones legales que surgen, como la ley de protección de datos de la Unión Europea, esta es un área de preocupación bastante urgente y que crece rápidamente en todas las redacciones.

State of Digital News Preservation Report

El nuevo informe del Instituto de Periodismo Reynolds de la Universidad de Missouri.

No se trata de si esto está pasando. Probablemente ya sucedió. Es típico que personas en una redacción puedan despublicar sin el conocimiento de los gerentes. La única manera de controlarlo es tener un plan y comunicarlo claramente a toda la organización. Comunicar tu política públicamente respaldará la transparencia y la responsabilidad.

  1.  Aclarar la propiedad del contenido en el CMS y otros sistemas

Dejar claro quién es el propietario y quién tiene licencia sobre el contenido que publicas ahora es importante. Mientras que la información de propiedad del contenido anterior puede ser difícil de establecer o corregir posteriormente, no hay razón para esperar para aclarar cualquier incertidumbre de propiedad sobre el contenido que tu redacción y autónomos están creando y publicando ahora.

Te sugerimos que investigues sobre las políticas, contratos y acuerdos de servicio actuales de tu empresa con respecto al contenido que publicas actualmente. Por ejemplo, ¿hay expectativas claras sobre quién tiene los derechos de las fotografías o videos que hacen tus fotógrafos? ¿Y sobre los derechos de los artículos, elementos gráficos, entrevistas en video y audio o los proyectos periodísticos de bases de datos? No hay una sola respuesta a estas preguntas, lo que es clave e importa es asegurar que esté claro para todos los involucrados.

Esto es un problema con el contenido creado por el personal autónomo. Hay que estar consciente de las implicaciones del caso de 2001 Tasini vs. The New York Times, por ejemplo. Es crucial que tomes medidas para asegurar que tu redacción siga las directrices que resultaron de ese caso. Y si ya tienes políticas o directrices claras, valdría la pena actualizarlas para garantizar que cubran la realidad digital de hoy en día, incluyendo todos los tipos de contenido (periodistas que solo graban video, por ejemplo), redes sociales y otros.

  1.  Realizar una autoevaluación de los metadatos, propiedad, procesos de trabajo

Para comprobar si tienes problemas con respecto a los factores mencionados anteriormente, sugerimos que realices pruebas sencillas, una autoevaluación sobre qué tal le va a tu organización de noticias con la preservación, identificación, y propiedad del contenido único que ha creado.

Estos son algunos ejemplos de preguntas que puedes hacer, y recursos adicionales para este proceso:

  • Autoevaluación: esta prueba puedes hacerla cualquier día para aclarar qué está ocurriendo en tus sistemas y procesos de trabajo. Comprueba si puedes identificar, ubicar y extraer la versión original de todas las fotografías y videos que publicó tu redacción hoy. No las múltiples copias que puedan aparecer en tu CMS. ¿Puedes hacerlo? Si es así, ¿este contenido tiene suficientes metadatos para mostrar claramente que tu empresa es propietaria de la imagen o video?
  • Ve un poco más allá, ¿tu CMS incluye campos que muestren claramente si el contenido es generado por el personal o viene de un periodista o fotógrafo autónomo, o de otra fuente de terceros? Si esos campos no están disponibles, considera tomar medidas para que se agreguen, estén visibles y editables en tus sistemas de gestión de contenido, y agrega pasos en el proceso de trabajo periodístico para garantizar que se llenen esos campos.
  • Comprueba qué contenido de noticias se está guardando, por cuánto tiempo, y qué contenido no se está guardando o se elimina después de un tiempo. En las redacciones hoy en día esta es una función que se delega al personal de tecnología, quienes en muchos casos no tienen suficientes, si hubiese, directrices para seguir. A falta de guías, el personal de servicio técnico puede eliminar por defecto contenido o purgar series de versiones según sea necesario solo para mantener el desempeño del sistema, una acción que puede ir inadvertidamente en contra de las buenas prácticas de preservación. 

Encontrar una manera de preservar copias de las fotografías con resolución completa, a todo color, en tamaño real, y los videos de noticias con todos los metadatos originales es uno de los pasos más importantes que puedes dar para la preservación a largo plazo. Sería genial si pudieras meter estos archivos en un sistema con una base de datos y almacenamiento redundante del contenido completamente indexado, pero incluso un sistema sencillo de memorias puede funcionar para iniciar este proceso. Nota: está bien guardar las imágenes en formato JPEG en lugar de los archivos en bruto de las imágenes, que ocupan mucho más espacio, ya que JPEG es un estándar aceptado.

Las noticias digitales como un registro histórico

La humanidad se puede beneficiar ampliamente de las lecciones de historia, pero solo si se transmite de generación en generación un registro claro y preciso. Si una pandemia mortal azota de nuevo en 100 años, ¿los periodistas, historiadores e investigadores en 2121 tendrán la oportunidad de beneficiarse de nuestra experiencia de hoy en día? La respuesta a esa pregunta no es evidente. Actualmente no hay un camino claro entre los sistemas que alojan el contenido de noticias digitales y alguna versión de archivos públicamente accesibles en el futuro. Por el estudio parece que, a pesar de muchos riesgos y desafíos, el contenido de noticias contemporáneo todavía se valora lo suficiente para no ser eliminado. La ventana de oportunidad para la preservación a largo plazo sigue abierta para mucho contenido de noticias que se origina en digital, pero esa oportunidad no durará indefinidamente.

Esta publicación es un extracto editado del nuevo artículo “El estado de preservación de las noticias digitales” publicado por el Instituto de Periodismo Donald W. en la Universidad de Misuri. Se vuelve a publicar aquí de acuerdo con la Licencia de atribución Creative Commons.

Recursos adicionales

Cómo usar “Wayback Machine”, el archivo de Internet que puede ser útil en tu próxima investigación

Desde cámaras secretas hasta la Dark Web: 7 de las mejores TED Talks para periodistas de investigación

Nuevas herramientas para organizar tu espacio de trabajo en casa y mejorar tus reportajes


Edward McCain es el curador digital de periodismo en el Instituto de Periodismo Reynolds de la Universidad de Missouri. Fue coautor de este informe con Neil Mara, Kara Van Malssen, Dorothy Carner, Bernard Reilly, Kerri Willette, Sandy Schiefer, Joe Askins y Sarah Buchanan.

Leave a Reply

Your email address will not be published. Required fields are marked *