
इंटरनेट आर्काइव यानि Wayback Machine पत्रकारों के लिए बहुत उपयोगी है। एक तरह का यह पुस्तकालय है। ज्ञान की सार्वभौमिक पहुंच हो: यही इसका मिशन है। इस वर्ष इसकी 25वीं वर्षगांठ है। Wayback Machine एक तरह का अभिलेखागार है। इसमें प्रतिदिन एक बिलियन से अधिक यूआरएल संग्रहित किए जाते हैं। इन्हें सार्वजनिक तौर पर वेब में उपलब्ध कराया जाता है।
दुनिया भर के पत्रकार, शोधकर्ता, तथ्य-जांचकर्ता, कार्यकर्ता और आम नागरिक प्रतिदिन इस निशुल्क Wayback Machine का विभिन्न तरीकों से काफी उपयोग करते हैं। हमारे बारे में हजारों लेख प्रकाशित हुए हैं। जीआईजेएन की My Favorite Tools 2020 series में विभिन्न खोजी पत्रकारों ने अपने लिए महत्वपूर्ण उपकरणों के बारे में बताया है। इसमें कई पत्रकारों ने कहा कि Wayback Machine उनके काम में काफी सहयोगी साबित हुई है।
आइए, समझते हैं कि एक पत्रकार के बतौर आप अपनी अगली खोजी खबर के लिए Wayback Machine का किस तरह उपयोग कर सकते हैं।
URL को आर्काइव करना
आप अपने लेख में किसी वेबसाइट की किसी सामग्री या पेज का संदर्भ देते हैं। लेकिन अगर उस वेबसाइट का मालिक उस सामग्री या पेज को वेबसाइट से हटा दे, तो वह ‘संदर्भ‘ हमेशा के लिए गायब हो जाएगा। आप अपने किसी संदर्भ के साथ ऐसा न होने दें!
Wayback Machine की “Save Page Now” सेवा में उपयोगकर्ताओं द्वारा प्रतिदिन लाखों यूआरएल संग्रहित (आर्काइव) किए जाते हैं। इसमें कोई भी व्यक्ति किसी भी यूआरएल को संग्रहित कर सकता है। यदि आप एक निःशुल्क खाते से लॉग-इन करते हैं, तो आप किसी भी ‘आउटलिंक‘ को संग्रहित कर सकते हैं। किसी ओरिजिनल पेज में दिए गए बाहरी लिंक को भी आप कैप्चर कर सकते हैं। इस कैप्चर प्रक्रिया की एक रिपोर्ट आपको ईमेल में मिल जाएगी।
यहाँ इसके कुछ तकनीकी पहलुओं को समझें। यदि आपके पास ऐसे यूआरएल की सूची है, जिन्हें आप संग्रह करना चाहते हैं, तो उन्हें गूगल शीट के ‘कॉलम ए‘ में रखकर सबमिट करें। इसे Save Page Now गूगल शीट सेवा के माध्यम से सबमिट करें। कॉलम बी, सी, और डी को एक स्टेटस कोड के रूप में रखते हुए आर्काइव किया जाएगा। जिन यूआरएल को Wayback Machine द्वारा पहले आर्काइव किया गया हो, उन्हें एक फ्लैग के साथ संग्रहित किया जाएगा।
एक अन्य विकल्प यह है कि आप किसी भी यूआरएल को “spn@archive-org” पर ईमेल करके सबमिट करें। इसके विषय में ‘कैप्चर आउटलिंक‘ लिख दें, तो इसे भी संरक्षित किया जाएगा। प्रक्रिया पूरी होने पर आपको ईमेल रिपोर्ट मिल जाएगी।
अंत में, तकनीकी रूप से अधिक कुशलता के लिए कुछ अन्य बातें जानना भी उपयोगी होगा। Wayback Machine एक API अथवा प्रोग्रामिंग इंटरफेस प्रदान करती है, जो आपके मौजूदा सॉफ्टवेयर वर्कफ्लो में एकीकरण की सुविधा प्रदान करती है। किसी नए अनुप्रयोग का निर्माण करते समय भी अपना काम स्वचालित करने में इससे मदद करेगी। इसका एक उदाहरण यह है कि सन् फ्रांसिस्को की गैर-लाभकारी प्रौद्योगिकी कंपनी Meedan ने अपनी ‘जांच‘ सेवा को वेबैक मशीन के साथ एकीकृत कर दिया है। यह कंपनी वैश्विक पत्रकारिता को मजबूत करने के लिए सॉफ्टवेयर का निर्माण और पहल करती है।
विभिन्न संग्रहित संस्करणों में परिवर्तन की जानकारी कैसे मिलेगी?
क्या आप किसी वेब पेज के दो संस्करणों में अंतर खोजना चाहते हैं? यह जानना चाहते हैं कि किसी व्यक्ति ने अपनी वेबसाइट में किस शब्द या वाक्य को बदल दिया है? आप ‘चेंज‘ आॅप्शन के जरिए यह देख सकते हैं।
इसके लिए Wayback Machine के होमपेज पर किसी भी संग्रहित यूआरएल को ‘सर्च‘ फंक्शन में डालें। फिर ‘चेंज‘ आॅप्शन चुनें।
इसमें आपको विभिन्न तिथियों और समय के अनुसार संग्रहित संस्करणों की सूची मिल जाएगी। हरेक संग्रहित यूआरएल में हुए परिवर्तन को दिखाने के लिए उस हिस्से को किसी रंग से चिन्हित किया जाता है।
इसके बाद किसी यूआरएल के दो संस्करणों का चयन करें। उनके टेक्स्ट में नीले और पीले रंग के जरिए अंतर दिख जाएगा। इस सुविधा का उपयोग करके आप देख सकते हैं कि एक ब्रिटिश राजनीतिक सलाहकार ने किस तरह इतिहास को फिर से लिखने की कोशिश की। इसे नीचे स्क्रीनशॉट में दिखाया गया है।

डोमिनिक कमिंग्स ने एक ब्लॉग पोस्ट में क्या बात जोड़ी, इसे Wayback Machine ने नीले रंग में दिखाया
Wayback Machine की ‘चेंज‘ सुविधा ने यह दिखाया कि ब्रिटिश प्रधानमंत्री के पूर्व मुख्य सलाहकार डोमिनिक कमिंग्स ने अपने मूल ब्लॉग पोस्ट (बाएं) में किस तरह की बातें जोड़ दी (नीले रंग में, दाहिनी तरफ देखें)।
ज्यादा गहराई से आर्काइव सर्च
Wayback Machine में संग्रहित यूआरएल से संबंधित टेक्स्ट की कोई लिस्ट उपलब्ध नहीं है। इसलिए इस सेवा में अब तक पूर्ण टेक्स्ट-सर्च की सुविधा उपलब्ध नहीं है। इसका अर्थ है कि उपयोगकर्ताओं के पास उस यूआरएल की जानकारी होनी चाहिए, जिसे वह अभिलेखागार में खोजना चाहते हैं। लेकिन खुशी की बात यह है कि Wayback Machine के इंजीनियर इस कोशिश में जुटे हैं कि अभिलेखागार के विशिष्ट संग्रह के लिए वेब पृष्ठों से संबंधित विभिन्न मेटाडेटा की अनुसूची बन जाए। (इंटरनेट आर्काइव होम पेज पर संग्रह हेतु उपलब्ध सेवाओं के बारे में अधिक जानकारी प्राप्त करें।)
Wayback Machine में API का उपयोग करना
Save Page Now सेवा के माध्यम से आर्काइव करने के लिए एक API के अलावा, ऐसे अन्य API भी हैं, जिनका उपयोग Wayback Machine में जानकारी के लिए किया जा सकता है। इसके जरिए यह देख सकते हैं कि क्या इसमें कुछ विशिष्ट यूआरएल संग्रहित किए गए हैं। आप यहां उनके बारे में विस्तार से पढ़ सकते हैं।
अपनी अधिकांश सेवाओं की तरह, Wayback Machine अपने API के उपयोग की आवृत्ति पर कोई औपचारिक रोक नहीं लगाता है। हालांकि, यह कभी-कभी विशेष उपाय लागू कर सकता है। यदि आपको Wayback Machine के उपयोग में कोई समस्या हो, तो हमें ईमेल भेजें या ट्विटर पर डायरेक्ट मैसेज करें। पत्रकारों की सहायता करना हमारी प्राथमिकता है।
आर्काइव किए गए पेजों में संदर्भ जोड़ना
किसी भी आर्काइव की गई सामग्री की बेहतर समझ के लिए उसकी उत्पति और संदर्भ की जानकारी महत्वपूर्ण है। इस बात को ध्यान में रखते हुए हमने अपने संग्रहित संसाधनों को बेहतर ढंग से समझने में मदद के लिए संदर्भ बैनर जोड़ना शुरू किया है। ऐसे बैनर का उपयोग तब होगा, जब किसी संग्रहित वेब पेज को हटाया जाए, या जब कोई पेज किसी ज्ञात शोध संगठन द्वारा लिखा गया हो।

Wayback Machine में संग्रहित पृष्ठों को बाहरी उपयोग से लिंक करने के लिए पीले हेडर का उपयोग हुआ है। साथ ही, ‘अबाउट दिस कैप्चर‘ टैब के जरिए पृष्ठ के बारे में अतिरिक्त ऐतिहासिक संदर्भ बताया गया है
प्रत्येक संग्रहित यूआरएल की उत्पति की जानकारी मिलना उस वेब पेज की समझ के लिए महत्वपूर्ण है। जैसे, क्या उस वेब पेज के अन्य तत्वों की तरह एक ही समय और दिनांक पर उसमें कुछ तस्वीरें भी थीं? आप प्रत्येक संग्रहित यूआरएल के प्लेबैक पृष्ठ के ऊपरी-दाईं ओर ‘अबाउट दिस कैप्चर‘ (About this capture) लिंक पर क्लिक करके यह जानकारी देख सकते हैं।
हमने इस अभिलेखागार की अखंडता बनाए रखने पर पूरा ध्यान रखा है। हमने काफी पारदर्शिता के साथ वर्षों से इसे कारगर बनाए रखा है। यही कारण है कि हमें व्यापक लोगों का विश्वास मिला है। दुनिया भर की विभिन्न अदालतों ने भी हमारे द्वारा संग्रहित सामग्री को साक्ष्य के बतौर स्वीकार किया है।
यदि आप हमारे Save Page Now फीचर के साथ बनाए गए अभिलेखागार के संदर्भ को कुछ जोड़ना चाहते हों, तो कृपया हमसे संपर्क करें।
ब्राउजर एक्सटेंशन
जैसा कि आप उम्मीद कर सकते हैं, हमारे पास Safari, Firefox, और Chrome के साथ-साथ iOS और Android के लिए देशी मोबाइल ऐप के लिए ब्राउजर एक्सटेंशन उपलब्ध हैं। इसके अलावा हमने Brave नामक सर्च इंजन के साथ भागीदारी की है।
इंटरनेट आर्काइव और Wayback Machine से कोई भी मदद लेने के लिए सिर्फ एक ईमेल भेजना या ट्विटर डीएम काफी है। कृपया अपने प्रश्न, अनुरोध, त्रुटि-रिपोर्ट और सफलता की कहानियां साझा करें। हम जानना चाहते हैं कि आपको हमारी सेवाओं में क्या चीज पसंद नहीं आई, या हमें क्या सुधार करना चाहिए, या जोड़ना चाहिए।
पर रुकिए…अभी और भी है !
Internet Archive Scholar service वेब पेजेज के सार्वजनिक संग्रह के अलावा इंटरनेट आर्काइव के माध्यम से 25 मिलियन से भी अधिक विद्वतापूर्ण दस्तावेजों को संरक्षित और उपलब्ध कराया जाता है। इसमें लगभग 30 मिलियन ई-बुक्स और टेक्स्ट उपलब्ध हैं। इनका अवलोकन करने या उधार लेने या इन्हें डाउनलोड करने की सुविधा है। साथ ही, लाखों घंटों में टीवी समाचार संग्रहित हैं जो पिछले दस वर्षों में दर्जनों अच्छे टीवी स्टेशनों से संबंधित हैं। इन्हें पूर्ण कैप्शन के माध्यम से सर्च किया जा सकता है।
इंटरनेट आर्काइव, और वेबैक मशीन की परियोजना और सेवाओं पर अप-टू-डेट जानकारी के लिए कृपया ट्विटर @internetarchive और @waybackmachine पर हमें फाॅलो करें और हमारे ब्लॉग पोस्ट पढ़ें।
और भी पढ़ें :
What is the Internet Archive and What Can I Find on It?
How to Use the Internet Archive’s Wayback Machine
मार्क ग्राहम ने Wayback Machine का पांच साल से अधिक समय तक प्रबंधन किया है। इससे पहले, वह NBC News Digital में वरिष्ठ उपाध्यक्ष थे। ग्राहम ने पहली यूएस-सोवियत ईमेल सेवा चलाने में भी मदद की। उन्होंने एक ऑनलाइन चर्चा प्रणाली के लिए पहला वेब-आधारित इंटरफेस बनाने की एक परियोजना शुरू की। उन्होंने महिलाओं के लिए एक प्रारंभिक ऑनलाइन सेवा iVillage चलाने में भी मदद की है।
Very interesting information.
Thanks a lot.
Regards.