डेटा जर्नलिज्म: संपादकों के लिए टिप्स

Print More

फोटो: शटरस्टॉक

“एक बड़ी बात जो मैं संपादकों से सुनती रही हूं, वह है : ‘हे भगवान, यह तो आंकड़ों की पत्रकारिता है। मैंने तो यह काम कभी किया नहीं। यह भी नहीं जानता कि करना क्या है। खबर बनाने में बहुत लंबा समय लगेगा।'” डेटा पत्रकारिता प्रशिक्षक मैरी-जो वेब्स्टर की यह टिप्पणी एक आम दुविधा को दर्शाती है। खासकर छोटे न्यूज़ रूम में, जहां कुछ युवा पत्रकारों के पास आंकड़ों का कौशल तो होता है, लेकिन असाइनमेंट डेस्क पर उनका साबका “खड़ी लाइन और पड़ी लाइन के खौफ” से पड़ जाता है।

फोटो: मैरी-जो वेब्स्टर 2015 से मिनियापोलिस स्टार ट्रिब्यून में डेटा संपादक हैं।

मिनियापोलिस स्टार ट्रिब्यून (मिनेसोटा, अमेरिका का उत्तरी राज्य) की डेटा एडिटर वेब्स्टर ने एक ऐसी गाइड तैयार की है जिसका मकसद संपादकों को इस दिशा में आगे बढ़ने का आसान रास्ता दिखाने का है। गाइड का पहला प्रस्थान बिंदु यह है कि डेटा-संचालित कवरेज का दायरा बढ़ाने के लिए उन्हें किसी उन्नत कौशल की आवश्यकता नहीं है। दूसरा, कुछ आसान तकनीकें अपने ही ढंग की खबरों की एक नई दुनिया खोल सकती हैं। तीसरी, और सबसे खास बात यह कि डरने की कोई जरूरत नहीं है। बकौल मैरी-जो वेब्स्टर, लोगों के बयानों का उपयोग करना अगर आप जानते हैं तो डेटा स्रोतों से अपना काम निकालना आपके लिए मुश्किल नहीं होगा।

वेब्स्टर यह स्वीकार करती हैं कि “‘क्यों?’ वाले सवालों के लिए डेटा कुछ खास कारगर नहीं होते।” साथ ही वे यह भी कहती हैं कि डेटा कौशल से वंचित संपादक लगभग हर मामले में पारंपरिक स्रोत वाले अपने नजरिये को लागू कर सकते हैं। इसके लिए उन्हें सिर्फ इतना करना होगा कि खबर में डेटा का इस्तेमाल उसी तरह करें, जैसे लोगों के बयान का करते हैं। (संपादक जानते है कि बहुत सारे बयानों को एक साथ नत्थी नहीं करना है। वे सही हैं या नहीं, इसकी ठीक से जांच कर लेनी है। और किसी की बात जहां उलझी हुई सी लगे, वहां उसे सुलझा कर पेश करना है। ये सारे काम उन्हें ठीक इसी तरह आंकड़ों के साथ भी करने होंगे।)

इन्वेस्टिगेटिव रिपोर्टर्स एंड एडिटर्ज़ (Investigative Reporters & Editors) नामक संस्था द्वारा आयोजित  NICAR22 डेटा पत्रकारिता सम्मेलन के एक सत्र में वेब्स्टर ने आंकड़ों के उपयोग की करामात के इर्दगिर्द छाए “रहस्य” के पार जाने और इनको अनोखे, दोस्ताना स्रोतों की तरह अंगीकार करने का एक कदम-ब-कदम खाका खींचा। निकार (एनआईसीएआर) का मतलब है नेशनल इंस्टीट्यूट फॉर कंप्यूटर-असिस्टेड रिपोर्टिंग ( National Institute for Computer-Assisted Reporting)। यह आईआरई का केंद्र है और इसको 1989 में शुरू किया गया था। दुनिया में डेटा पत्रकारिता का श्रीगणेश करने में इसने एक अहम भूमिका निभाई है।

तस्वीर: स्क्रीनशॉट

वेब्स्टर ने कहा- “जरूरत इस बात की है कि हर संपादक सोचे : ‘अरे, शायद यहां एक डेटा लगाने की गुंजाइश है।” उन्होंने यह भी बताया कि इस खास मामले में नौसिखिया संपादकों का आंकड़ों से अपरिचय खबर के लिए  फायदेमंद हो सकता है। कारण यह कि आंकड़ों से उनके ही जितने अनजान आम दर्शकों/पाठकों के सामने खबर के सही होने का सबूत कैसे पेश किया जाना चाहिए, यह बात वे अच्छी तरह जानते हैं।

वे कहती हैं कि कोई भी संपादक आंकड़ों को खबर के लिए तीन तरह से मूल्यवान मान सकता है:

  1. अपने रिपोर्टरों और फोटोग्राफरों को कहां लगाया जाए, इसके लिए एक दिशा निर्देशक के रूप में। वेब्स्टर का कहना है कि बुनियादी डेटा- जैसे एक खास इलाके में कोविड-19 के संक्रमणों में आए उछाल, या दंगों में क्षतिग्रस्त हुई अल्पसंख्यक-स्वामित्व वाली दुकानों के अनुपात से जुड़े नगरपालिका के आंकड़े- रिपोर्टरों की तैनाती के लिहाज से असाइनमेंट संपादकों के लिए काफी अच्छे गाइड हो सकते हैं, हालांकि इनका उपयोग कम ही हो पाता है। “‘हमें किसका इंटरव्यू करना चाहिए? शहर के किस हिस्से पर अपना ध्यान केंद्रित करना चाहिए?’ – एक खबर के लिए डेटा अगर इतनी भी मदद कर पाता है तो यह बहुत अच्छी बात है।”
  2. परंपरागत रिपोर्ट के रूप में पेश की जाने वाली खोजबीन की रीढ़ के रूप में। वेब्स्टर ने कहा- “आंकड़ों का यह वह प्रकार है जो बाकी हर तरह की पारंपरिक रिपोर्टिंग को बांधे रखता है।” एक उदाहरण के रूप में, उन्होंने 2018 में स्टार ट्रिब्यून की यौन उत्पीड़न संबंधी न्यायिक जांच के सबूतों की ओर इशारा किया। इसमें एक स्व-निर्मित डेटासेट के जरिये यह साबित किया जा सका था कि राज्य में पुलिस और अभियोजकों ने यौन उत्पीड़न के मामलों को या तो खराब तरीके से हैंडल किया था, या फिर यह काम वे बिल्कुल नहीं कर पाए थे।
  3. संदर्भ के लिए – जहां डेटा समस्या को पारिभाषित करता है, या मुद्दे को समझने में पाठकों की मदद करता है। उन्होंने बताया कि “यह शायद आंकड़ों का सबसे आम इस्तेमाल है। खबर संभवतः डेटा के बिना भी जा सकती है, लेकिन डेटा के जरिये आपको कुछ और भी हासिल होता है। मसलन, कुछ उदाहरण, कुछ ब्यौरे।” आगे वेब्स्टर ने बताया कि ‘कौन’, ‘क्या’, ‘कब’ और ‘कहाँ’ वाले सवालों के लिए डेटा बहुत अच्छी भूमिका निभाता है। इस भूमिका में विज़ुअलाइज़ेशन खास तौर पर महत्वपूर्ण हो जाता है। उदाहरण के लिए, शहर के अलग-अलग इलाकों में अलग-अलग तरह की आपातकालीन सेवाओं में लगने वाले समय की सूची, यहां तक कि इसके लिए ग्राफों का इस्तेमाल भी नीतिगत विफलता को ठीक से नहीं दर्शा पाता। इसमें अल्पसंख्यक समुदायों के खिलाफ भेदभाव मौजूद हो सकता है, जिसको ठीक से प्रदर्शित करने के लिए शहर के नक्शे पर आंकड़ों की अलग-अलग रेंज के लिए भिन्न-भिन्न रंगों का उपयोग पाठकों को एक ही नजर में समझा सकता है कि हकीकत में हो क्या रहा है।

खबर के लिए असाइनमेंट देने की प्रक्रिया

वेब्स्टर अपनी गाइड में कई वैकल्पिक उपायों का खाका खींचती हैं- अपने खुद के सर्वेक्षण से लेकर रिपोर्टरों की ओर से सूचना के अधिकार के तहत अर्जी डलवाने तक। लेकिन निकार के सत्र में उन्होंने एक और भी महत्वपूर्ण कदम को रेखांकित किया।

डेटा से जुड़ी संभावनाओं पर पहले ही बातचीत कर लें – खबर का आइडिया रखे जाने के साथ ही। वेब्स्टर कहती हैं- “यह खास तौर पर जरूरी है कि जब बीट रिपोर्टरों की मीटिंग चल रही हो और किन खबरों पर काम किया जाए, इस बारे में विचार-मंथन चल रहा हो, तभी आंकड़ों में मौजूद संभावनाओं पर चर्चा कर ली जाए। साथ ही इस पर भी, कि किस-किस तरह के डेटा देखे जाने चाहिए। कुछ खबरें स्वाभाविक रूप से आंकड़ों की मांग करती हुई सी लगती हैं। बाकी के बारे में आपको लगता है कि जैसी सूचनाओं की जरूरत आपको है, वे सीधे आपको कहीं मिल ही नहीं सकतीं।” वेब्स्टर ने इन मंथन सत्रों के दौरान खबरों की ऐसी कई किस्मों की पहचान कराई, जो हमेशा जरूरी डेटा की खोज और उसके विश्लेषण की मांग रिपोर्टरों के सामने रखती हैं:

  • ऐसी खबरें, जिनमें किसी चीज की माप निकालने की जरूरत होती है। अगर आपको लगे कि आपका पाठक यह जानना चाहेगा कि कोई खास मुद्दा कितना बड़ा है, तो अपने रिपोर्टरों से आंकड़ों की तह में जाने के लिए कहें। तब भी, जब खबरों से जुड़ी मीटिंग में ऐसे सवाल उठें कि “अमुक परिघटना अन्य जगहों की तुलना में हमारे यहां कितनी महत्वपूर्ण है? या, समय के साथ यह किस तरह बदली है? या फिर, सबसे ज्यादा यह कहाँ देखी जाती है?” उदाहरण के लिए, स्टार ट्रिब्यून की एक डेटा स्टोरी में पाया गया कि उपनगरों में पैदल चलने वालों को कार दुर्घटनाओं में लगी चोटें अधिक गंभीर थीं, और ऐसी 3,000 से ज्यादा दुर्घटनाओं में केवल 25 कार चालकों पर आपराधिक धाराएं लगाई जा सकी थीं। रिपोर्टर ने पुलिस रिपोर्ट कोड से इन चालकों के नाम निकाले, फिर अदालती दस्तावेजों में इनकी तलाश की और पैदल यात्रियों के साथ होने वाली दुर्घटनाओं का एक इन-हाउस डेटाबेस बनाया।
  • रिपोर्टर जिस एक चौंकाने वाले आंकड़े का जिक्र करते हैं, उसके पीछे मौजूद बड़ी खबर। उदाहरण के लिए, यदि एक रिपोर्टर को किसी स्रोत से जानकारी मिलती है कि इमारतों में आग लगने की घटनाएं पिछले साल की तुलना में 25 फीसदी बढ़ गई हैं, तो संपादक उसे ऐसे आंकड़ों की तलाश में जाने के लिए कह सकते हैं जो इस तरह के सवालों के जवाब देते हों : “क्या ये घटनाएं मुख्यतः घरों में आग लगने की थीं? क्या ऐसी घटनाओं में हुई तेज वृद्धि के पीछे लोगों का धूम्रपान करना या स्पेस हीटर लगाने जैसा कोई कारण मौजूद था? ”
  • ऐसी खबरें, जो यह जांचती हैं कि जनता से किया गया कोई वादा पूरा किया गया या नहीं, या फिर यह कि कोई कार्यक्रम कारगर हो पाया या नहीं। इसकी व्याख्या वेब्स्टर ने इस तरह की कि “पैसा किसी काम के लिए खर्च किया गया था। यह दिखाने के लिए डेटा मौजूद होना चाहिए कि पैसे को जहां पहुंचना चाहिए था वहां पहुंचा या नहीं, या फिर इसे बुद्धिमानी से खर्च किया गया या नहीं।”
  • क्या यह वास्तव में सच है?” और किसने क्या कहाटाइप की खबरें। डेटा लोकप्रिय मिथकों या सिद्धांतों के सही या गलत होने का परीक्षण कर सकता है। “उदाहरण के लिए, हमने पूछा, ‘क्या यह दावा सही है कि श्वेत और अश्वेत बच्चों को साथ-साथ पढ़ाने के लिए मिनियापोलिस और सेंट पॉल में 90 के दशक में किए गए व्यापक स्कूली प्रयासों के बाद उन्हें अभी फिर से अलग-अलग कर दिया गया है?” वेब्स्टर कहती हैं और आगे बताती हैं- “जवाब निकला : हाँ, स्कूलों ने वाकई ऐसा किया है।”
  • हाल-फिलहाल चल रही गंभीर खबरें। वेब्स्टर ने कहा, “जब आपके पास कोई ऐसा मुद्दा होता है जो हर समय खुद को दोहराता हुआ सा लगता है, तो किसी बिंदु पर आपको पीछे हटकर उससे जुड़ी बड़ी तस्वीर की कहानी कहनी होती है।” आगे यह कि “इस दिशा में आगे बढ़ने के क्रम में रीयल-टाइम डेटा हासिल करने में आपको नाकों चने चबाने पड़ सकते हैं, लेकिन एक बार यह हाथ लग जाए तो एक ही खबर को रोज दोहराते रहने की मजबूरी से जान छुड़ाने में आपको काफी मदद मिल सकती है।”

वेब्स्टर ने संपादकों को आगाह किया कि वे रिपोर्टरों से प्रतीकात्मक सांख्यिकी की तरह “सिर्फ एक खबर या ग्राफिक में डालने के लिए” एकाध आंकड़ा उठा लाने को न कहें। उन्होंने कहा- “बेहतर होगा कि उनसे यह पूछें : ‘डेटा से हमें ऐसे कौन से सवाल मिल सकते हैं जो कहीं और से शायद न मिल सकें?’, या फिर यह कि जो बातें लोग हमें बता रहे हैं, उनकी पुष्टि के लिए क्या कुछ आंकड़े जुटाए जा सकते हैं?”

चेकलिस्ट : क्या किसी डेटा-संचालित खबर पर समय लगाना ठीक रहेगा?

“कई संपादकों को यह कहना अच्छा लगता है: ‘ओह, लेकिन इसमें तो बहुत ज्यादा वक्त लगेगा!’” वेब्स्टर ने डेटा आधारित खबरों के लिए अक्सर ज्यादा रिपोर्टिंग की जरूरत का संदर्भ देते हुए कहा। “लेकिन क्या पता, खबर सचमुच इसके लायक हो। इस बारे में आश्वस्त होने के लिए कुछ सवालों पर विचार करना चाहिए।”

  • क्या यह ‘वॉचडॉग स्टोरी’ है? ऐसी खबर, जिसमें बड़ा प्रभाव डालने या कोई बदलाव शुरू करने की संभावना हो?
  • क्या हम अभी फटाफट एक खबर कर सकते हैं, और उसका डेटा-चालित अंश बाद में चला सकते हैं?
  • खबर की मुख्य सूचना और दस्तावेजों तक पहुंच बनाने के लिए संभावित समय सीमा क्या है?
  • क्या यह आपके रिपोर्टर की बीट का एक महत्वपूर्ण मुद्दा है?
  • क्या इस खबर में एक मध्यम आकार वाले या बड़े उद्यम का एक टुकड़ा बन सकने की संभावना मौजूद है?
  • क्या पहले से ही कोई और इस खबर का विश्लेषण कर रहा है – ताकि आपका कुछ समय बच सके?

 डेटा आ चुका है। अब क्या?

  • जैसे ही डेटा आना शुरू होता है, संपादकों को उसके सत्यापन और बुलेट-प्रूफिंग की प्रक्रिया शुरू कर देनी चाहिए। इसके लिए खबर फाइल होने का इंतजार नहीं करना चाहिए।
  • आंकड़ों के जो हिस्से जरूरत से ज्यादा सच्चे लगें, उनकी जांच तीन बार करें।
  • हर डेटासेट को एक व्हिसलब्लोअर की तरह लें : “हम इसके बारे में क्या जानते हैं? कैसे पता करें कि यह भरोसेमंद है या नहीं? यह हमारे पास आया कैसे?”
  • पूछें कि क्या डेटा निष्कर्ष पारंपरिक रिपोर्टिंग से मिल रहे साक्ष्य से भिन्न हैं। डेटा गलत हो सकता है।
  • “स्टार” नतीजे की पहचान करें : सबसे न्यूजी चीज क्या निकल रही है।
  • डेटा एनालिसिस रिपोर्टर से कहें कि आपको एक सामान्य व्यक्ति मानकर अपने निष्कर्षों को सरल ढंग से वह आपको समझाए।

संख्याओं के साथ संपादन से जुड़े कुछ टिप्स:

  • संख्याओं और अनुपातों के बारे में अपने ज्ञान को ताज़ा करें, और इसके लिए अच्छी गाइड्स का सहारा लें। मसलन, सारा कोहेन की “नंबर्स इन द न्यूजरूम” गाइड।
  • संख्याओं के साथ वैसा ही बरताव करें, जैसा खबर में बयानों के साथ करते हैं – कभी भी उनका गुच्छा न बनने दें, जहां जरूरत हो सिर्फ वहीं इनको लगाएं, और जहां जरूरी समझें वहां इनकी व्याख्या भी करें।
  • वह करें जो आप अपने रिपोर्टरों से करने के लिए कहते हैं : जो संख्याएं आपके सामने रखी जा रही हैं, उनके बारे में बेवकूफी वाले सवाल पूछने से न डरें।
  • दशमलव से बचें – खासकर उन चीजों के लिए, जिन्हें बांटा नहीं जा सकता। जैसे व्यक्तियों के लिए।
  • अपने पाठकों को हिसाब-किताब के लिए मजबूर न करें।
  • जहां भी संभव हो, परिचित ब्यौरों के जरिये बात समझाएं।
  • संख्याओं के उन रूपों का उपयोग करें जो लोगों की समझ में आ सकें – जैसे “0.07%” के बजाय “10,000 में से 7″। या एक समूचे देश पर आने वाले खर्च के आंकड़े के बजाय ‘प्रति व्यक्ति खर्च’ का उपयोग करें।
  • जब सूची में बहुत अधिक संख्याएं हों तो बार ग्राफ़ जैसे विज़ुअलाइज़ेशन का उपयोग करें।
  • एक “स्टार” संख्या चुनें, और खबर की शुरुआत में ही उस पर ध्यान केंद्रित करें।

वेब्स्टर ने समझाया कि “डेटा पत्रकारिता की तुलना पारंपरिक पत्रकारिता के साथ करने से इसकी शक्ल न्यूज़रूम के एक कोने में चल रहे जादुई काम जैसी नहीं रह जाती। बल्कि यह कुछ ऐसी चीज बन जाती है, जिसको पत्रकार पहले से जानते हैं।” यह भी कि “रिपोर्टर जिन इंसानी स्रोतों का हवाला देते हैं, उनके बारे में कोई नतीजा कैसे निकाला जाए, यह बात संपादकों पहले से पता होती है। आंकड़ों के साथ भी मामला बिल्कुल वैसा ही है।”

अतिरिक्त संसाधन

GIJN’s Top 10 Data Journalism Projects of 2021

Data Journalism Training, Books, Websites, and Conferences

12 Tips for Getting Started With Data Journalism


रोवन फिलिप GIJN के लिए कार्यरत रिपोर्टर हैं। रोवन पहले दक्षिण अफ्रीका के अखबार संडे टाइम्स के चीफ रिपोर्टर हुआ करते थे। विदेश संवाददाता के रूप में उन्होंने पूरी दुनिया के दो दर्जन से अधिक देशों से समाचार, राजनीति, भ्रष्टाचार और टकरावों पर रिपोर्टिंग की है।

Leave a Reply

Your email address will not be published. Required fields are marked *