Como arquivista, adoro as cenas clichês em filmes de mistério quando um jornalista de cabelos grisalhos pega uma caixa empoeirada de uma pilha oscilante de arquivos em sua garagem, com todas as provas necessárias – milagrosamente livres de insetos e mofo – para trazer um malfeitor à justiça. Para mim, isso é uma fantasia tão rica quanto os finais felizes dos filmes.
Passei vários anos trabalhando ao lado de jornalistas em uma redação, onde testemunhei algumas áreas de trabalho físicas e virtuais completamente desordenadas. O processo de reportagem consumia meus colegas. Normalmente, mesmo antes de uma história ser publicada, eles já começavam a gerar novos arquivos para a próxima reportagem, levando a uma possível confusão quando precisavam recuperar anotações antigas, se quisessem revisitar um assunto ou se tivessem dúvidas sobre as conclusões tiradas de suas histórias.
Cuidar bem dos dados requer tempo e dinheiro, mas a perda de um trabalho de reportagem insubstituível pode ter um custo maior. Pode ser difícil ou impossível retornar aos entrevistados, recuperar documentos governamentais que aparecem e desaparecem de sites oficiais, ou apenas encontrar um detalhe que pode estar em uma gravação de áudio, ou talvez em uma conversa por e-mail, ou foi uma mensagem de texto?
Os jornalistas têm três considerações principais para equilibrar enquanto planejam preservar materiais investigativos. Além das questões gerais de preservação, que são minha área de especialização, eles também precisam considerar questões legais e de segurança digital.
Lynn Oberlander, advogada especializada em mídia, que atuou como consultora interna para publicações como The New Yorker e meu ex-empregador The Intercept, e que atualmente trabalha no escritório de advocacia Ballard Spahr, aconselha que “como princípio básico, a responsabilidade legal não deve governar a forma como os jornalistas fazem seu trabalho”. Consequentemente, se fazer anotações ou gravações pode beneficiar um repórter no futuro, ela recomenda que esses materiais sejam preservados.
Mas, ao mesmo tempo, ela observa a importância de pesar os riscos de arquivar informações de histórias altamente confidenciais. “Se você está trabalhando com fontes confidenciais, não prevê a necessidade de voltar aos registros e não foi explicitamente informado de que será processado, pode valer a pena ter a prática de se livrar do material de suas fontes”, explica Oberlander. Ela ainda observa que para minimizar o risco para as fontes, nesses casos, é vital seguir protocolos de segurança adequados que podem incorporar o uso de computadores não conectados à Internet, ferramentas de mensagens e discos rígidos com criptografia e outras medidas semelhantes.
Ela tem outro princípio geral que os repórteres devem ter em mente: “Qualquer que seja o seu método, seja consistente. Se você tem todas as suas anotações dos últimos 20 anos, exceto de uma história que pode ser problemática, se apenas essas foram excluídas – isso pode ser um problema.”
A consistência é um princípio fundamental para a preservação digital. Os arquivistas não têm uma fórmula precisa sobre como etiquetar pastas ou com que frequência fazer backup de seus arquivos. Em vez disso, aconselho a criação de um sistema que faça sentido para você, aplicando alguns princípios básicos que descreverei a seguir, depois cumpra-o.
E embora seja impossível resumir a segurança digital em um breve artigo – é toda uma criação de práticas, começando no momento em que você cria materiais ou se comunica com fontes e dependendo de vários fatores, desde os temas que você cobre até leis específicas no país onde você trabalha — a consistência é vital para manter esses materiais seguros também. Omitir qualquer etapa de um protocolo de segurança recomendado pode colocar um documento valioso ou uma fonte confidencial em risco.
Emilia Díaz-Struck, editora de pesquisa e coordenadora da América Latina do Consórcio Internacional de Jornalistas Investigativos (ICIJ), também enfatiza a consistência, tanto para fins de segurança quanto para evitar dores de cabeça mais tarde. Sua principal dica para repórteres que estão começando projetos de investigação é simples: “Planeje com antecedência”. Ela ressalta que começar com um conjunto claro de decisões sobre onde armazenar o material investigativo à medida que você o acumula é muito mais simples do que tentar entender uma pasta de downloads cheia de dados no meio de um projeto.
Aqui estão algumas dicas básicas para jornalistas que desejam melhorar suas práticas de arquivamento pessoal. Essas etapas estão relacionadas principalmente a histórias com níveis de segurança baixos a médios. As reportagens de nível de segurança nacional exigem adesão rigorosa a protocolos, que podem incluir o armazenamento de todos os materiais em dispositivos “air-gapped” (computadores que tiveram sua placa de rede wireless removida e nunca foram conectados à Internet), destruição de certos materiais e até medidas de segurança física.
1. Armazene os arquivos relacionados em uma pasta e dê às pastas nomes que façam sentido
Estabeleça um formato de nomenclatura consistente para seus projetos. Uma data, o nome da publicação, caso você escreva para diferentes veículos, e algum texto descritivo: “202107_GIJN_digitalpreservation” é um exemplo de um formato simples e compreensível de nomenclatura de arquivos. Crie uma pasta seguindo esse formato para cada projeto e salve os arquivos relevantes nessa pasta. Embora pesquisar o conteúdo de seu disco rígido seja uma maneira de localizar dados, você pode economizar tempo com esse método organizacional básico. É especialmente importante armazenar mídias, como capturas de tela, fotos, áudio e vídeo – que você não pode pesquisar em texto simples e que geralmente têm nomes de arquivos genéricos criados por seu computador, câmera ou gravador de áudio – em pastas claramente identificadas.
Renomear arquivos, seguindo seu formato, pode ajudar a identificar facilmente dados importantes que você planeja usar ou citar em seu artigo. Se você faz anotações ou tem arquivos em papel relacionados a uma reportagem, etiquete o caderno ou as pastas onde você guarda esses itens com o mesmo nome que você usou para a pasta digital, para que você possa correlacioná-los facilmente. Eu também recomendo manter um registro de quaisquer acordos com o veículo que está publicando a história junto com os arquivos relacionados; diferentes organizações podem ter regras variadas sobre propriedade de materiais e sua reutilização.
Díaz-Struck, do ICIJ, recomenda especificamente a criação de uma pasta distinta dos dados e documentos que respaldam as declarações feitas em suas reportagens. Se, posteriormente, você decidir excluir alguns dos arquivos que acumulou, manter um registro claro dos materiais que você cita o protegerá caso alguém conteste suas descobertas, ou mesmo para refrescar sua memória sobre como você tirou suas próprias conclusões. Como sua equipe trabalha com dados no ICIJ, eles certificam-se de etiquetar a versão original dos dados, bem como a versão final; eles também documentam sua metodologia e quaisquer transformações que fazem nos dados, e arquivam esse documento sobre o processo junto com os próprios dados.
2. Faça backup de seus arquivos e, em seguida, faça backup deles novamente
Um dos acrônimos mais importantes e cativantes no trabalho de arquivamento é LOCKSS: “Lots Of Copies Keeps Stuff Safe” (em português, “muitas cópias mantêm as coisas seguras”). Como os arquivos digitais são facilmente replicáveis, é simples gerar várias cópias para ajudá-lo em caso de perda de dados. É crucial salvar pelo menos uma cópia em um local físico diferente. Por exemplo, fazer backup dos arquivos do seu computador em um disco rígido externo é um ótimo primeiro passo. Mas se você optar por manter o computador e a unidade de backup em sua mesa e o teto sobre sua mesa apresentar um vazamento, você perderá os dados – a menos que também tenha feito backup de seus arquivos na nuvem. Por outro lado, se um upload para o backup na nuvem não funcionar corretamente, você poderá perder dados, a menos que os tenha salvo em um disco rígido.
- Faça backup dos arquivos em um disco rígido externo. Programas como o Time Machine da Apple e o Backup do Windows tornam esse processo fácil de automatizar – ou apenas crie um lembrete no calendário para copiar pastas-chave regularmente. Quando o disco rígido estiver cheio, etiquete-o claramente, talvez com o intervalo de datas dos arquivos que você está arquivando, e armazene-o em um local fresco e seco. Se você tiver um orçamento para o seu arquivo, poderá optar por uma matriz RAID, que é essencialmente um conjunto de discos rígidos vinculados. As unidades RAID armazenam dados de forma redundante; ou seja, se uma unidade na matriz falhar, os dados permanecerão seguros. Se o seu projeto tiver algum nível de sensibilidade, criptografe sua unidade com uma senha segura.
- Para arquivos não confidenciais, considere fazer backup de seus arquivos em um serviço de nuvem. O serviço selecionado pode variar dependendo da sua localização, necessidades específicas e orçamento. Por exemplo, se você trabalha com arquivos de vídeo e áudio, pode priorizar um serviço que ofereça muito armazenamento de forma barata, como o Backblaze. Você pode preferir trabalhar com um serviço de backup mais seguro com servidores fora do país onde mora, como Sync ou Tresorit, que criptografam arquivos em trânsito e quando estão sendo armazenados.
- Se você preferir não usar um serviço de backup em nuvem – uma medida prudente ao lidar com dados confidenciais ou ao relatar tópicos de segurança ou inteligência nacional – faça backup do disco rígido em outro disco rígido e armazene-o em um local fisicamente diferente de onde você mora ou trabalha. Mantenha uma cópia em casa e uma cópia no escritório ou, para maior segurança, envie-a para um amigo em uma cidade ou país diferente para que, em caso de problema, seja um furacão ou uma batida policial, seus dados não sejam destruídos. Para arquivos confidenciais, você pode usar um serviço oculto do Tor, como o OnionShare, para transferir arquivos para um colega em quem você confia para armazená-los em uma máquina criptografada, seguindo os protocolos de segurança adequados. Sempre consulte um especialista em segurança digital antes de realizar qualquer uma dessas etapas. Por mais que o LOCKSS possa ser um princípio sólido de arquivamento, às vezes a proliferação de cópias de certos materiais sensíveis pode aumentar os riscos.
3. Salve o produto final
Em 2017, em resposta a uma tentativa de sindicalização da equipe, o bilionário Joe Ricketts fechou a rede de sites de notícias locais que possuía – incluindo os arquivos inteiros dos sites. Os arquivos eventualmente voltaram, mas seu apagamento momentâneo demonstra a efemeridade do conteúdo de notícias online. O conteúdo também pode desaparecer por motivos não maliciosos, como uma mudança em um sistema de gerenciamento de conteúdo que dificulta a localização de conteúdo antigo por meio de pesquisa ou uma mudança no modelo de negócios de um site que não priorize mais o conteúdo de arquivo.
Embora o Internet Archive capture uma quantidade significativa de dados, ele não captura todas as páginas de todos os sites todos os dias, o que significa que um artigo ou postagem individual pode passar despercebido ou exigir que você gaste uma quantidade significativa de tempo pesquisando várias capturas para encontrar a página exata que você precisa. Se você teme que um governo hostil ou bilionário consiga que seu artigo seja retirado do ar, ou se você simplesmente deseja manter um registro preciso de seu trabalho, vale a pena o esforço para preservar seu produto final. Peças com componentes interativos apresentam desafios adicionais. À medida que a tecnologia da web muda, as visualizações ou animações podem não ser renderizadas corretamente, mesmo que a página tenha sido raspada pelo Internet Archive. Para manter um registro de seu trabalho publicado, siga os seguintes passos:
- Certifique-se de que um artigo seja salvo pelo Internet Archive adicionando a extensão Wayback Machine ao seu navegador; clicar nele irá automatizar um rastreamento pelo Internet Archive.
- Salve o site como PDF e adicione-o à pasta onde você salvou os materiais relacionados. Embora você possa perder algum conteúdo gráfico, o PDF é considerado um formato de arquivo e é fácil de fazer backup e abrir em várias outras ferramentas.
- Para reportagens com componentes interativos, crie uma gravação do site usando o Conifer, uma ferramenta de gravação da web originalmente inventada para a preservação de obras de arte baseadas na internet. O Conifer permite que você abra um site e crie uma gravação à medida que você navega por seus recursos: dicas de ferramentas de abertura, reprodução de vídeo ou GIFs e assim por diante. Você pode então baixar a gravação como um WARC (o mesmo formato de arquivo usado para salvar páginas da Web no Internet Archive) e até mesmo “reproduzir” o site como se fosse um vídeo.
Fundamentalmente, é importante lembrar que o arquivamento digital é uma prática contínua, não um conjunto de etapas que você pode seguir e depois esquecer. Não há equivalente digital de uma caixa empoeirada em uma garagem; as tecnologias mudam, e as medidas que você toma para garantir que seus arquivos estejam acessíveis no futuro também devem evoluir (imagine se você tivesse todas as suas notas de entrevista em disquetes!).
No final, lembre-se de que nenhuma pessoa ou organização é obrigada a preservar seu trabalho criativo. Se você deseja um registro do que criou na mídia, precisa agir. E como jornalista, seu trabalho de arquivamento é vital. Arquivos de notícias – seja em frágeis volumes de papel de jornal, em microfilmes, em blocos de notas no arquivo pessoal dos repórteres e agora na forma de bits e bytes – contribuem significativamente para nossa compreensão coletiva da história. Só porque o tempo é volátil, seu registro não precisa ser.
Recursos adicionais
The Activists’ Guide to Archiving Video (O guia dos ativistas para arquivar vídeos): Este manual foi criado pela organização sem fins lucrativos internacional WITNESS para apoiar indivíduos que desejam criar e compartilhar com segurança registros em vídeo de abusos de direitos humanos. Mesmo que você não trabalhe com vídeo, essas dicas, que incluem analisar, criar e excluir metadados de arquivos; melhores práticas de proteção da fonte; e transferência e backup de arquivos seguros, têm muita relevância para os jornalistas que criam materiais em campo.
Preserve This Podcast: Projetado para podcasters independentes, os recursos deste site (inclui artigos, um podcast e um zine) ilustram claramente os detalhes práticos básicos do arquivamento de mídia para não profissionais.
Digitalpreservation.gov: A Biblioteca do Congresso dos Estados Unidos tem um site claro (embora um pouco mais antigo) com foco em como digitalizar materiais analógicos e armazenar com segurança as cópias digitalizadas.
Freedom of the Press Foundation: A FPF oferece vários recursos de treinamento para jornalistas que pensam em segurança digital e proteção de fontes.
Endangered But Not Too Late: The State of Digital News Preservation (Em perigo, mas ainda não tarde demais: o estado da preservação de notícias digitais): Se você estiver interessado em se aprofundar nesse tópico, o Reynolds Journalism Institute da Universidade de Missouri realizou este extenso estudo das práticas de arquivamento das organizações de notícias, com recomendações sobre como garantir que o conteúdo de notícias digitais possa servir como um recurso histórico daqui para frente. A RJI também está desenvolvendo ferramentas de código aberto que ajudarão as organizações de notícias a preservar seu conteúdo.
Talya Cooper é arquivista e pesquisadora, baseada em Nova York. Ela trabalhou como arquivista do arquivo Edward Snowden no The Intercept e como gerente de arquivo no StoryCorps. Ela é coautora, com Alison Macrina, de “Anonymity”, um guia de tecnologia de antivigilância e privacidade para bibliotecários.