भारत में अपराध संबंधी आंकड़ों के रखरखाव का दायित्व ‘नेशनल क्राइम रिकॉर्ड ब्यूरो‘ (एनसीआरबी) पर है। गृह मंत्रालय के अंतर्गत वर्ष 1986 में इसकी स्थापना हुई थी। यह देश में अपराध संबंधी आँकड़े संग्रहित और प्रकाशित करता है। इसने वर्ष 2017 में धार्मिक मामलों के कारण हत्या और किसानों की आत्महत्या जैसे आंकड़े जुटाना बंद कर दिया। इसके कारण पत्रकारों के पास यह पता लगाने का कोई रास्ता नहीं रह गया कि ऐसे मामले बढ़ रहे हैं, अथवा नहीं। हालांकि मीडिया में आने वाली खबरें बताती हैं कि ऐसे मामलों में उछाल आया है।
इसी तरह, घृणा अपराध (हेट क्राइम) पर भी आधिकारिक तौर पर नजर नहीं रखी जा रही है। हिन्दुस्तान टाइम्स ने वर्ष 2017 में घृणा/नफरत के शिकार लोगों के मामलों का दस्तावेज बनाने के लिए एक ‘नफरत ट्रैकर‘ (हेट ट्रैकर) शुरू किया था। लेकिन सरकारी दबाव में इसे रोकना पड़ा। संपादक बॉबी घोष को पद छोड़ने के लिए कहा गया। कुछ ऐसा ही हश्र एक अन्य प्रयास का भी हुआ। ऑनलाइन वेबसाइट ‘इंडिया स्पेंड‘ द्वारा बनाए गए ‘हेट ट्रैकर‘ को भी बंद करना पड़ा। इसके संपादक समर हलर्नकर ने भी इस्तीफा दे दिया।
यह आलेख ‘रॉयटर्स इंस्टीट्यूट फॉर द स्टडी ऑफ जर्नलिज्म‘ में मेरी फैलोशिप परियोजना के अनुभवों पर आधारित है। मैंने संचार शोधकर्ता डॉ. सिल्विया माजो-वाजक्वेज के मार्गदर्शन में यह काम किया। अपराध के जिन मामलों पर सरकारी डेटा उपलब्ध हो, उन पर पत्रकार किस तरह जांच और रिपोर्टिंग करें? ऐसे मामलों पर डेटा एकत्र करने, उनकी जांच करने और खबर बनाने संबंधी विषयों की जानकारी यहां प्रस्तुत है।
डेटा कैसे निकालें?
सबसे पहले मैंने घृणा अपराध (हेट क्राइम) को इस तरह परिभाषित किया- “किसी धर्म, जाति, पृष्ठभूमि, लिंग, शारीरिक या मानसिक अक्षमता, अथवा यौन रूचि के प्रति पूर्वाग्रह के कारण होने वाले अपराध।“
इसके बाद मैंने पहली जनवरी 2014 से 31 दिसंबर 2020 तक के अंग्रेजी समाचार मीडिया में प्रकाशित घृणा अपराधों की खबरें जुटाईं। हर खबर का लिंक कॉपी किया। हर मामले का संक्षिप्त विवरण एक स्प्रेडशीट में दर्ज किया।
इसमें मैंने दंगों के मामलों को अलग रखा, क्योंकि इन्हें पूरी तरह से सूचीबद्ध करने के लिए मेरे पास पर्याप्त समय और संसाधनों का अभाव था। इसमें मैंने सोशल मीडिया रिपोर्ट्स को भी शामिल नहीं किया, क्योंकि वैसी खबरों को सत्यापित करना मेरे लिए संभव नहीं था। मैंने क्षेत्रीय भाषा के मीडिया की खबरों को भी शामिल नहीं किया क्योंकि अन्य भाषाओं की खबरों का सटीक अनुवाद करने के लिए संसाधन नहीं थे।
इस तरह, अंग्रेजी मीडिया में घृणा अपराध संबंधी 212 घटनाओं का विवरण एक गूगल शीट में तैयार हुआ। मैंने हर मामले में तारीख, हिंसा के प्रकार, लिंग, पीड़ितों और अपराधियों का सामाजिक-आर्थिक विवरण, उनका धर्म, जाति, राजनीति और पुलिस की प्रतिक्रिया जैसे विवरणों को सूचीबद्ध किया। फिर मैंने इन अपराधों का पैटर्न और रुझान समझने के लिए डेटा का विश्लेषण किया। पूरी रिपोर्ट डाउनलोड करें ।
एक और बात स्पष्ट करना जरूरी है। इस रिपोर्ट में हम ऐसा कोई दावा नहीं कर रहे कि यह कोई प्रतिनिधि डेटा है। किसी भी डेटा को प्रतिनिधि डेटा तब कहा जाता है, जब वह संपूर्ण डेटाबेस पर आधारित हो। अथवा जिसमें सभी ज्ञात घटनाओं के नमूने लिए गए हों। इसके बजाय हमने सिर्फ उपलब्ध स्रोतों पर निर्भर रहते हुए यह स्टडी की है। इसमें केवल अंग्रेजी समाचार मीडिया में आई खबरों को शामिल किया गया है। इसलिए संपूर्ण भारत में घृणा अपराधों की व्यापकता और विशेषताओं की बेहतर समझ के लिए एक व्यापक डेटाबेस के आधार पर स्वतंत्र स्टडी करना उपयोगी होगा।
मुझे इस स्टडी में डॉ. सिल्विया माजो-वाजक्वेज जैसी संचार शोधकर्ता का मार्गदर्शन मिला। लेकिन कोई जरूरी नहीं कि ऐसी स्टडी करने वाले हर पत्रकार को वैसा मार्गदर्शन मिल जाए। इसलिए जो पत्रकार ऐसे मामलों पर स्टडी करना चाहते हों, उनके लिए मेरे अनुभवों के आधार पर यहां कुछ सुझाव प्रस्तुत हैं। यदि आप अपराधों के सरकारी आंकड़ों तथा हकीकत को समझने के लिए अपना स्वयं का डेटाबेस बनाने की योजना बना रहे हैं, तो यह आलेख आपके लिए उपयोगी होगा।
1. अपनी डेटा शीट व्यावहारिक बनाएं
मैंने स्टडी की शुरुआत में हर मामले की सभी जानकारी को डेटा शीट में जोड़ने की भरपूर मेहनत की। जैसे, पीड़ित के पेशे को रिकॉर्ड करते हुए आईटी प्रोफेशनल, किसान, छात्र, दुकानदार जैसी हर श्रेणी को लिख लिया। इस तरह लगभग 40 श्रेणियां बन गईं। इसके कारण यह आकलन कर पाना मुश्किल हो गया कि किस सामाजिक-आर्थिक समूह के पीड़ित ज्यादा हैं। लेकिन बाद में डॉ. सिल्विया माजो-वाजक्वेज की मदद से मैंने पीड़ितों के पेशे को सिर्फ पाँच श्रेणी में सीमित कर दिया- ब्लू-कॉलर कर्मचारी, सफेद-कॉलर कर्मचारी, छात्र, धार्मिक कार्यकर्ता, और अन्य। इसके बाद यह आकलन करना आसान हो गया कि घृणा अपराध का निशाना किस समूह को बनाए जाने की संभावना अधिक है।
2. पूर्व धारणाओं को बदलने के लिए तैयार रहें
आपका डेटाबेस आपकी पूर्वकल्पित धारणाओं से विपरीत हो सकता है। लेकिन आप अपनी पूर्व धारणाओं या पूर्वाग्रह के आधार पर किसी भी डेटा को न तो छोड़ सकते हैं, और न ही शामिल कर सकते हैं। मतलब यह है कि आपकी पूर्व धारणा चाहे जो भी हो, आपके पास जो तथ्य आएंगे, उन्हीं के आधार पर विश्लेषण करना होगा।
3. अशुद्धियों से बचें
आपको रिपोर्ट में शब्दों और वर्तनी की अशुद्धियों से बचने की भरपूर कोशिश करनी चाहिए। यह मामूली समस्या लग सकती है। लेकिन एक या दो शब्दों की स्पेलिंग गलत होने से उस वर्कशीट को इंटरनेट में सर्च करना मुश्किल हो जाएगा। जैसे, क्षेत्र के अंतर्गत यदि आप किसी राज्य की स्पेलिंग गलत लिख दें, तो यह हो सकता है कि वह सर्च रिजल्ट में न दिखाई दे। कॉपी एडिटिंग नीरस या अरुचिकर काम लगता है। लेकिन इसी प्रक्रिया में हम लोगों ने आसानी से डेटा का विश्लेषण कर लिया।
4. ऐसे कॉलम हटाएं जिनमें पर्याप्त डेटा नहीं है
प्रारंभ में हमने डेटा शीट में ‘पीड़ित की राष्ट्रीयता‘ दर्ज करने के लिए भी कॉलम रखा था। लेकिन रिकॉर्ड से पता चला कि अधिकांश पीड़ित भारतीय थे। इसलिए ‘राष्ट्रीयता‘ कॉलम रखने से कोई फायदा नहीं था। इसी तरह कुछ अन्य कॉलम थे, जैसे- ‘पीड़ित की यौन अभिरूचि‘ और ‘अपराध के मूकदर्शक‘ – लेकिन इन दोनों मामले में जानकारी इतनी कम उपलब्ध थी कि ऐसे कॉलम का भी कोई मतलब नहीं रह गया। इसलिए ऐसे कॉलम को हमने हटा दिया। बेहतर होगा कि आप उस डेटा पर ध्यान दें, जो आपके सेट में उपलब्ध है।
5. फुटनोट में आवश्यक सूचनाएं दें
किसी भी स्टडी और डेटाबेस हरेक शब्द का पूरा विवरण देना संभव नहीं होता। लेकिन जिन संगठनों, घटनाओं, जगहों तथा प्रसंगों का उल्लेख आता हो, उनके बारे में फुटनोट आवश्यक सूचनाएं देना उपयोगी होता है। किसी संस्था के नाम का संक्षिप्त रूप हो या किसी प्रसंग का वर्णन करना हो, उसकी जानकारी या उसका लिंक फुटनोट के रूप में डाल दें। ऐसा करने पर डेटासेट का उपयोग करने वाला कोई भी व्यक्ति आपके फिल्टर को तोड़े बगैर या आपके डेटा सेट को अव्यवस्थित किए बगैर समझ लेगा।
6. सीधे सवाल हों, हर संभावना को ध्यान में रखें
किसी डेटाबेस में हाँ/नहीं वाले प्रारूप में कॉलम बनाकर आप आसानी से महत्वपूर्ण नतीजे निकाल सकते हैं। ऐसा करते समय आपको हर तरह की संभावना को भी ध्यान में रखना होगा। जैसे, कोई अपराध होने पर सामान्यतः हम सिर्फ किसी आरोपी के खिलाफ पुलिस में रिपोर्ट दर्ज होने की कल्पना करते हैं। लेकिन हमने अपने डेटाबेस में आरोपी और पीड़ित, दोनों पक्ष के लिए कॉलम बनाया। क्या पुलिस ने प्राथमिकी दर्ज की? ऐसे सवालों के जवाब दर्ज करने पर चौंकाने वाले परिणाम देखने को मिले। पुलिस ने 13 प्रतिशत मामलों में आरोपी के साथ ही पीड़ित के खिलाफ भी प्राथमिकी दर्ज की।
इन विषयों का सच सामने लाएं
सरकार जिन मामलों की सूचनाएं जनता से छुपा रही हैं, उनका सच सामने लाना खोजी पत्रकारों का दायित्व है। ऐसे मामलों की सूची लंबी होती जाती है। स्वतंत्र खोजी पत्रकारों को पता लगाना चाहिए कि कोविड-19 से कितने स्वास्थ्य कार्यकर्ता संक्रमित हुए? महामारी के दौरान क्षेत्रों में कितने आगंनबाड़ी सामाजिक कार्यकर्ताओं को रोजगार से वंचित होना पड़ा? कोरोना के कारण स्कूल छोड़ने वाले बच्चों की संख्या कितनी है? कितने छोटे बड़े व्यवसाय बंद हो गए। ऐसे विषयों पर डेटा एकत्र करना उपयोगी होगा। सूचना का अधिकार कार्यकर्ताओं पर हमलों की संख्या का पता लगाना भी एक जरूरी काम है। ऐसे विभिन्न विषयों पर खोजी पत्रकारिता के लिए सावधानीपूर्वक निगरानी और डेटा की आवश्यकता है। ऐसी खबरें आधिकारिक स्रोतों से नहीं मिल पाएंगी।
आधिकारिक डेटा के अभाव के कारण पैदा शून्य को भरने का काम भी हो रहा है। भारत में विभिन्न पत्रकारों, शिक्षाविदों और कार्यकर्ताओं ने कई महत्वपूर्ण मुद्दों पर डेटाबेस बनाना शुरू कर दिया है। जैसे, ‘आर्टिकल 14‘ (Article 14 ) ने ‘एक दशक का अंधकार डेटाबेस प्रोजेक्ट‘ शुरू किया। इसमें पिछले 10 वर्षों में दर्ज किए गए राजद्रोह के मामलों का दस्तावेजीकरण किया जा रहा है। सरकार द्वारा पत्रकारों और कार्यकर्ताओं पर देशद्रोह का आरोप लगाने और ‘राष्ट्र-विरोधी‘ का ठप्पा लगाने की प्रवृति बढ़ती जा रही है।
निष्कर्ष
मुझे उम्मीद है कि यह आलेख पत्रकारों को ऐसे डेटा निकालने में मदद करेगा। जिन सवालों पर डेटा चाहिए, उन्हें कैसे परिभाषित करें, डेटा कैसे एकत्र करें, कैसे रिपोर्ट करें और जरूरी सवालों का जवाब कैसे दें, यह समझना भी आसान होगा।
‘हेट क्राइम ट्रैकर‘ पर अब तक काम नहीं हुआ है। मैं इसे ऑनलाइन करना चाहती हूं। इसके लिए इच्छुक पत्रकारों को डेटा जुटाने और कैटलॉग करने के लिए आमंत्रित करती हूं। इसमें अभी केवल अंग्रेजी मीडिया संगठनों की रिपोर्ट है। हम क्षेत्रीय भाषा की रिपोर्ट को भी शामिल करके इसका विस्तार कर सकते हैं।
क्राउड-सोर्सिंग पर आधारित ऐसी परियोजनाओं में कई तरह की चुनौतियां भी होती हैं। सूचनाओं एवं डेटा की गुणवत्ता सुनिश्चित करना एक बड़ा काम है। प्रविष्टियों का दोहराव, रोकना तथा हर रिपोर्ट का सत्यापन करना भी आसान नहीं है। परिणामों की व्याख्या में भी किसी पूर्वाग्रह से बचना एक बड़ी चुनौती है। ऐसे जोखिम के प्रति सचेत रहते हुए यह कोशिश करने लायक है।
यह लेख मूल रूप से रॉयटर्स इंस्टीट्यूट ने प्रकाशित किया था। जीआईजेएन ने लेखक की कुछ अतिरिक्त सामग्री जोड़ी है, जिसमें पूरा पेपर भी शामिल है।
अतिरिक्त संसाधन
Interpreting Data: Tips to Make Sure You Know How to Read the Numbers
How One Mexican Data Team Uncovered the Story of 4,000 Missing Women
रेचल चित्रा एक फाइनेंस जर्नलिस्ट और टाइम्स ऑफ इंडिया की विशेष संवाददाता हैं। उनमें मानवीय विषयक खबरों को डेटा के माध्यम से प्रस्तुत करने का जुनून है। वह रॉयटर्स, न्यू इंडियन एक्सप्रेस और डेक्कन क्रॉनिकल में काम कर चुकी हैं। रॉयटर्स इंस्टीट्यूट के लिए उनकी परियोजना के तहत ‘भारत में मुसलमानों और दलितों की लिंचिंग और बलात्कार‘ के मामलों का दस्तावेजीकरण किया गया है।