ProPublica’dan Craig Silverman sayfaların nasıl toplu olarak arşivleneceğini, değişikliklerin nasıl karşılaştırılacağını ve bir sayfanın öğelerinin ne zaman arşivlendiğini nasıl görebileceğinizi açıklıyor.
Digital Investigations‘ın bir önceki sayısında Wayback Machine‘den en iyi şekilde yararlanmak için tavsiyeler sunmuştum. Şimdi Wayback Machine’in yöneticisi Mark Graham ile yaptığım röportaj sayesinde daha da fazla ipucu ile karşınızdayım.
Bahsetmeyi unuttuğu birkaç özelliğin yanı sıra farkında olmadığım bir özelliğe de işaret etti. Ayrıca sosyal medya içeriğini arşivlemenin zorluğu hakkında da konuştuk.
Wayback Machine, tüm bilgiye evrensel erişim sağlamaya adanmış 27 yıllık bir kar amacı gütmeyen kuruluş olan Internet Archive tarafından yönetiliyor. Graham, “Biz dijital bir kütüphaneyiz” diyor.
Bir kütüphane olarak, kullanıcılar yerine müşterilere sahip olduğunu söylüyor. Gazeteciler ve araştırmacılar için bazı faydalı özellikleri inceleyelim.
1. Değişiklikleri Görüntüleme ve Karşılaştırma
Değişiklikler özelliği, aynı arşivlenmiş sayfanın farklı sürümlerini karşılaştırmanıza ve farklılıkları görmenize olanak tanır.
Graham, “Belki bir gazeteci, bir web sayfasındaki içerik materyalinin zaman içinde nasıl değiştiğini gösteren bir hikaye yazıyordur”. “Bu durumda, Wayback Machine’in Değişiklikler özelliği hakkında bilgi sahibi olmaları gerekir; burada bir URL’deki materyali iki farklı zaman noktasında karşılaştırabilirsiniz.”
Değişiklikler özelliğine Wayback Machine’de göz attığınız arşivlenmiş herhangi bir sayfanın üst menüsünden erişebilirsiniz:
Resim: Ekran görüntüsü
Doğrudan şu URL biçimiyle de yükleyebilirsiniz: https://web.archive.org/web/changes/https://www.nytco.com/journalism/
Karşılaştırmak istediğiniz URL’yi https://web.archive.org/web/changes/ adresinden sonra yerleştirdiğinizde, yıl yıl arşiv ızgaralarını gösteren bir sayfa açılacaktır:
Resim: Ekran görüntüsü, Wayback Machine
Gölgeli her kare bir sayfa yakalamaya karşılık gelir ve renk açıklaması hangi günlerde önemli değişiklikler olabileceğini gösterir. İki yakalama seçin ve ardından sayfanın üst kısmındaki “Karşılaştır” düğmesine tıklayın. Yakalamaların yan yana bir görüntüsünü elde edersiniz.
Mart 2023’ün başlarından (solda) ve Ocak 2022’nin başlarından (sağda) bir sayfa seçtim. Karşılaştırma, New York Times’ın gazetecilikle ilgili kurumsal sayfasının alt menü seçeneklerini ve metni güncellediğini gösterdi:
Resim: Ekran görüntüsü, Wayback Machine
2. Sayfa Öğelerini Doğrulamak için ‘Bu Yakalama Hakkında’yı kullanın
Wayback Machine’in temel tanımı, web sayfalarının arşivlerini yakalaması ve depolamasıdır. Gerçek ise biraz daha nüanslı.
Graham, “Web dağınıktır, web sürekli değişir, ve sürekli değişiyor derken, dinamik de olabilir.”
Kendisine arşivin Wayback Machine’de listelenen tarih ve saatte bir sayfada tam olarak ne olduğunu gösterdiğinden ne kadar emin olabileceğimizi sordum. Kısa cevap, evet, güvenebilirsiniz. Ancak arşivlenmiş bir sayfanın öğeleri, her biri kendi zaman damgasına sahip farklı arşivlenmiş materyallerden alınabilir. İşte nüans burada ortaya çıkar.
Wayback Machine, bir sayfadaki farklı öğelerin zaman damgalarını görüntülemenizi sağlayan bir özelliğe sahiptir. Bu özelliğe, bir sayfa yakalamanın sağ üst köşesindeki “Bu yakalama hakkında” düğmesine tıklayarak erişebilirsiniz:
Resim: Ekran görüntüsü
Örnek olarak https://www.nytco.com/journalism/ adresini kullanırsak, işte elde ettiğimiz sonuç:
Resim: Ekran görüntüsü, Wayback Machine
Sayfa 20 Ekim 2021’de arşivlenmiş olsa da, yakalama işlemi bazı öğeleri yeni arşivlerden çekmekte. Yukarıda listelenen sayfa öğelerinin çoğu, sayfa şablonunu oluşturan resimlerdir. Birkaç dosya ise JavaScript ve CSS. Graham, Wayback Machine’in sayfayı görüntülediğinizde sayfayı oluşturmak için farklı görüntülerden, JavaScript ve CSS dosyalarından yararlandığını açıkladı.
“Bir sayfayı yeniden oynattığımızda, aslında kendi URL’si tarafından temsil edilen sayfa gerekliliklerinin her birini kendi arşiviyle birlikte alıp bir araya getiriyoruz. Zorluklardan biri, bu nesnelerin her birinin tarihte farklı bir zamanda arşivlenmiş olma ihtimali.”
Örneğin, sayfanın en üstündeki ana fotoğraf (“17XP-PULITZERS2-superJumbo-article.jpg”) arşivi yüklememden 8 gün önce çekilmiş bir fotoğraftan alınmıştır. Bu fotoğraf/dosya araştırmanız için önemliyse, zaman içinde değişip değişmediğini görmek için arşiv sayfasını kontrol etmek veya hedef tarihe daha yakın bir çekim aramak isteyebilirsiniz. Ancak bu dosya zaman içinde aynı kaldığı sürece sorun yok demektir.
Resim: Ekran görüntüsü, New York Times kurumsal web sitesi
Genel ama mutlak olmayan bir kural olarak, tipik bir web sayfasındaki gövde metni ayrı bir sayfadan veya dosyadan alınmaz. Bu nedenle bu dinamikten etkilenme olasılığı daha düşüktür. Ancak en güvenli seçenek “Bu yakalama hakkında” seçeneğini işaretlemek ve alıntı yaptığınız sayfa yakalamasındaki metin, resim veya başka bir öğenin ilgilendiğiniz tarihle tutarlı olduğundan emin olmaktır.
Graham bana Google E-Tablolar’ı kullanarak arşivleme için URL’leri toplu olarak yükleyebileceğinizi de hatırlattı. İşlem oldukça basit. Öncelikle, arşivlemek istediğiniz URL’leri listeleyen tek sütunlu bir Google Sheet oluşturun. Ardından Google hesabınızı archive.org hesabınıza bağlamak için buraya gidin.
Resim: Ekran görüntüsü, İnternet Arşivi
Bu işlem tamamlandığında, bu ekranı göreceksiniz. “URL’leri Arşivle” üzerine tıklayın.
Resim: Ekran görüntüsü, İnternet Arşivi
Artık arşivlemek istediğiniz URL’leri içeren Google Sayfanıza bir bağlantı ekleyebilirsiniz.
Resim: Ekran görüntüsü, İnternet Arşivi
Google ve archive.org hesaplarınıza bağlandığınız için, tüm yakalamalar kolay erişim için archive.org hesabınızda saklanacaktır.
“Bu özellik, eşimin bir keresinde bana ‘Mark, bir grup URL’yi nasıl kolayca arşivleyebilirim?’ diye sorması üzerine ortaya çıktı.” dedi.
Graham bunu gerçekleştirmek için Internet Archive’daki mühendislerle birlikte çalıştı.
4. Geri Bildirimlerinizi ve Taleplerinizi E-posta ile Gönderin
Graham, “Wayback Machine’in birçok özelliği bugün mevcutsa bunun sebebi kullanıcıların istekleri, sorularu, önerileri veya tavsiyede bulunmaları. İstekleri ve soruları gerçekten takdir ediyoruz.”
Yani insanları info@archive.org adresine e-posta göndermeye teşvik ediyor.
Graham, “Günde yüzlerce e-posta alıyoruz ve bunları inceleyip yanıtlayan bir ekibimiz var” dedi. “Wayback Machine ile ilgili olup da ilk aşamada yanıtlanamayanlara bizzat ben yanıt veriyorum.” diyor.
Graham özellikle gazetecileri soruları ya da talepleri olduğunda kendilerine ulaşmaları konusunda teşvik ediyor.
Bonus Bilgi: Sosyal Medyayı Arşivleme
Wayback Machine’in güçlü kullanıcıları, sosyal medya içeriğini burada arşivlemenin zor ile imkansız arasında değiştiğini bilirler. Bunun Wayback Machine’in işlevselliği ve sınırlamalarından çok Meta gibi şirketlerin kazıma işlemini nasıl engellediğiyle ilgisi var.
Graham’ın sosyal medyadaki içeriği arşivlemenin neden zor olduğu hakkında söyledikleri şöyle:
Bazı web sitelerinin arşivlenmesi diğerlerine göre daha zor olduğu gibi, özellikle Facebook ve Instagram’ın arşivlenmesi de zorluklar içermektedir. Kazıma da dahil olmak üzere çeşitli otomasyon türlerini önlemeye çalışmak için aktif önlemler alıyorlar. Örneğin Facebook sitesine girerseniz, web kazıma ve web arşivlemeyi önleme çabalarına ayırdıkları personelden bahsettikleri web kazıma hakkında bir bölüm var.
Web’e saygı duyarak çalışıyoruz. Bu bizim materyalimiz değil. Bir kütüphane olarak, materyalleri genel kullanıma sunmak için çalışıyoruz. Facebook ve Instagram söz konusu olduğunda bunu deniyoruz. Ve kamuya açık bilgileri arşivlemenin bizim için tamamen uygun olduğunu düşünüyoruz. Örneğin, Ukrayna veya Çin’in iletişim departmanlarının kamuya açık Facebook sayfaları gibi.
Graham’ın Wayback Machine’in sosyal medya arşivlemesini geliştirmek için “çeşitli medya kuruluşlarıyla aktif olarak çalıştığını” söylemesi sevindirici bir haber. Umarım işler yakında düzelir.
Bu yazı ilk olarak Craig Silverman’ın Digital Investigations Substack bülteninde yayınlanmış ve burada izin alınarak yeniden yayınlanmıştır.
Ek Kaynaklar
BuzzFeed’den Craig Silverman ile Favori Araçlarım
Gazetecilerin Hayatını Kolaylaştıracak 5 Çevrimiçi Araştırma Aracı
Bir Sonraki Araştırmanızda İnternet Arşivinin Wayback Makinesini Kullanmak İçin İpuçları
Craig Silverman, ProPublica muhabiridir. Dezenformasyon ve çevrim içi manipülasyon konularını ele almaktadır. Daha önce BuzzFeed News’in medya editörüydü ve dijital dezenformasyon haberleri yapıyordu.