সাংবাদিক মার্সেলো সোয়ারেস ডেটা দিয়ে দেখিয়েছেন, ব্রাজিলের শহরগুলোতে কোভিড-১৯ মৃত্যুর প্রকৃত সংখ্যা, কর্তৃপক্ষের দাবি করা সংখ্যার চেয়ে অনেক বেশি। তিনি সাবেক দুই শিক্ষার্থীর সাহায্য নিয়ে এই ডেটা সংগ্রহ করেন।
“মার্চ মাসে, ব্রাজিলে এই মহামারির শুরুর দিনগুলোতে, স্বাস্থ্য মন্ত্রণালয়ের ডেটার স্বল্পতা দেখে আমি খুবই অবাক হয়েছিলাম,” বলেছেন সোয়ারেস। “তারা শুধু প্রদেশ-ভিত্তিক সংখ্যাগুলো প্রকাশ করত। প্রাদেশিক পর্যায়ের কর্তৃপক্ষ যে সময় তাদের ডেটাগুলো প্রকাশ করে, তার চেয়েও কিছু দেরিতে প্রকাশিত হতো স্বাস্থ্য মন্ত্রণালয়ের ডেটা।”
ডেটার্যাপার, ফ্লোরিশ ও গুগলের ডেটা স্টুডিও ব্যবহার করে, সোয়ারেস তৈরি করেছেন ইন্টারঅ্যাকটিভ গ্রাফিক্স, যার মধ্যে একটি হিট ম্যাপও ছিল। প্রতিবেদনগুলোসহ এই সব কিছু প্রকাশিত হয়েছে ব্রাজিলিয়ান রিপোর্টে।
সোয়ারেস বলেছেন, “শহর পর্যায়ের ডেটা পাওয়ার জন্য আমি ২৭টি প্রদেশেই খবরাখবর নেওয়া শুরু করি। একেক প্রদেশ একেক ফরম্যাটে তাদের ডেটা উপস্থাপন করেছে, এবং এই ফরম্যাট প্রতিদিনই বদলে যায়। ফলে সব কিছু স্বয়ংক্রিয়ভাবে করে ফেলাটা কঠিন ছিল।”
প্রতিটি পৌরসভা-ভিত্তিক ডেটা সংগ্রহ করার জন্য সোয়ারেস প্রতিদিন প্রাদেশিক স্বাস্থ্য অধিদপ্তরগুলোতে গেছেন; এবং দেখেছেন, কেন্দ্রীয় সরকারের ডেটার চেয়ে প্রাদেশিক পর্যায়ের ডেটাগুলো বেশি হালনাগাদ অবস্থায় পাওয়া যায়। কারণ কেন্দ্রীয় সরকারের মন্ত্রণালয় সেগুলো ফোনের মাধ্যমে সংগ্রহ করে।
“পৌরসভা থেকে কেন্দ্রীয় সরকার পর্যন্ত, একটি জাতীয় তথ্য আদানপ্রদানের ব্যবস্থা থাকলেও, সেখানে অনেকগুলো সমান্তরাল ব্যবস্থা কাজ করে,” বলেছেন সোয়ারেস।
বিভিন্ন জায়গা থেকে সোয়ারেস যেসব ডেটা সংগ্রহ করেন, তাদের একেকটি ছিল একেক ফরম্যাটে। ফলে সেগুলো একসঙ্গে করে বিশ্লেষণ করার জন্য তাঁকে সব কিছু একটি সাধারণ ফরম্যাটে আনতে হয়েছে।
“কিছু ডেটা ছিল এইচটিএমএল টেবিল আকারে, কিছু ছিল মাইক্রো ডেটা, কিছু ছিল পিডিএফ রিপোর্ট আকারে, এবং অ্যামাজন প্রদেশের একটি অঞ্চলের ক্ষেত্রে, ডেটাগুলো ছিল সোশ্যাল মিডিয়া কার্ড আকারে। মার্চ মাসে, এই বিভিন্ন ফরম্যাটের ডেটা নিয়ে কাজ করার জন্য আমাকে দিনে আধা ঘন্টা সময় দিতে হয়েছে, এবং এটি কাজে লেগেছে।”
এপ্রিলের মাঝামাঝিতে, সোয়ারেস এই ডেটা সংগ্রহের জন্য দিনে তিন ঘন্টা করে সময় দিয়েছেন। এবং একটি ডেটা জার্নালিজম কোর্সের দুই সাবেক শিক্ষার্থী, পেদ্রো তেইক্সেইরা ও ফ্যাবিও ফ্রেলারকে সঙ্গে নিয়েছেন এই কাজে সহায়তার জন্য।
সোয়ারেস বলেছেন, “মজার ব্যাপার হলো, সাংবাদিকতায় ডিগ্রী নেওয়ার আগে দুজনই ইঞ্জিনিয়ারিং পড়া শুরু করেছিল। এবং প্রোগ্রামিং নিয়ে তাদের আগ্রহ আছে।”
সোয়ারেস আবিস্কার করেছেন: বিভিন্ন ধরনের শব্দ/বাক্য দিয়ে শ্রেণীবদ্ধ করার মানেই সেসব কোভিড-১৯ মৃত্যু হিসেবে ধরা হয়নি।
সোয়ারেস ব্যাখ্যা করে বলেছেন, “পরীক্ষার মাধ্যমে নিশ্চিত হওয়ার আগে হওয়া কোভিড মৃত্যুগুলোকে সাধারণত সিভিয়ার অ্যাকিউট রেসপিরেটরি সিনড্রোম (এসআরএজি) নামে শ্রেণীবদ্ধ করা হয়েছে।” এই বিষয়টি বুঝে ফেলার পর, তাঁরা সব এসআরএজি মাইক্রো ডেটাগুলো তাদের গবেষণায় অন্তর্ভূক্ত করেছেন।
সোয়ারেস এই করোনাভাইরাস গবেষণার লাইভ চার্ট প্রকাশ করেন তাঁর ওয়েবসাইট, লাগুম ডেটা-য়। এখানে নিউজরুম ও সিভিল সোসাইটি সংগঠনের ব্যবহারের জন্য ডেটাগুলো সংগ্রহ, বিশ্লেষণ ও ভিজ্যুয়ালাইজ করা হয়।
ডেটা বিশ্লেষণের জন্য সোয়ারেস ব্যবহার করেছেন গুগল ডেটা স্টুডিও-র বিগকোয়েরি নামের একটি টুল। সেই কাজের নমুনা রিপোর্টটি পাবেন এখানে।
সোয়ারেস বলেছেন, “এই টুল দিয়েই আমি শহর-ভিত্তিক ডেটাগুলো এক জায়গায় করেছি। এটি অনেক মেটাডেটা দিয়েও সমৃদ্ধ করা গেছে। (যেমন শহরের ক্ষেত্রে বলা গেছে এটি রাজধানী কিনা, অ্যামাজনের ভেতরে কিনা বা সীমান্তবর্তী এলাকা কিনা ইত্যাদি)। ৪০ হাজার লাইন হওয়া পর্যন্ত এই ডেটাগুলো ছিল একটি গুগল শিটে।”
দ্রুতই, আরো অনেক সংবাদমাধ্যম এই ডেটাগুলো ব্যবহার শুরু করে। সাও পাওলোর একটি সাপ্তাহিক সাক্ষাৎকার-ভিত্তিক শো, রোডা ভিভা-তে এর কথা উল্লেখ করা হয়।
টেলিভিশন সাক্ষাৎকারের পর, ওয়েবসাইটের পাঠক বাড়তে থাকে। ফলে এপ্রিলের শেষ দিকে, ওয়েবসাইটটি আরো উন্নত করা ও সাহায্যকারী শিক্ষার্থীদের বেতন দেওয়ার জন্য লাগুম ডেটা ব্যবহারের একটি সাবস্ক্রিপশন-ভিত্তিক মেম্বারশিপ চালু করেন সোয়ারেস।
জুনের শুরুতে, এই ডেটা প্রকাশ করা থেকে তাঁকে বিরত করার চেষ্টা করেছিল ব্রাজিল সরকার। কিন্তু এতে বরং হিতে বিপরীত হয়। ওয়েবসাইটটি আরো অনেকের মনোযোগ আকর্ষণ করে এবং সাবস্ক্রাইবার বেড়ে যায়। নতুন এই সাবস্ক্রাইবারদের মধ্যে কেউ কেউ ছিলেন উর্ধ্বতন কর্মকর্তা।
সোয়ারেস জানিয়েছেন, “নতুন গ্রাহকদের মধ্যে একজন ছিলেন ব্রাজিলের উত্তরাঞ্চলের রাজ্য পরিকল্পনা সচিব। আরেকজন ছিলেন সর্বজন শ্রদ্ধেয় স্বাস্থ্য গবেষক, যিনি সরকারের হুমকির কারণে ব্রাজিল ছেড়েছেন।”
কেউ কেউ বিভিন্ন প্রতিষ্ঠান পুনরায় খোলার সিদ্ধান্ত নেওয়ার ক্ষেত্রেও সোয়ারেসের এই ডেটার ওপর নির্ভর করেছেন।
“সাও পাওলোর বেসরকারি স্কুলগুলোকে সমন্বয় করেন – এমন একজন ছিলেন আমাদের নতুন গ্রাহক। শহরের বিভিন্ন শিক্ষা প্রতিষ্ঠান কখন খুলে দেওয়া যায়, সেই পরিকল্পনা করার জন্য তাঁর এই ডেটা দরকার হয়েছিল।”
“আমি আমাদের এই গ্রাহকদের জন্য খুবই গর্বিত। কিন্তু কিছুই সম্ভব হতো না, আমার শিক্ষার্থীদের সহায়তা ছাড়া,” বলেছেন সোয়ারেস।
তারা যেভাবে কাজটি করেছেন
তেইক্সেইরা ও ফ্রেলারের সাথে কাজ করা নিয়ে খুবই আগ্রহী ছিলেন সোয়ারেস।
তিনি বলেছেন, “এই শিক্ষার্থীদের কাজের ব্যাপারে আমি জানতাম। মনে হয়েছিল, এটি তাদের সঙ্গে কাজ করার ও এই ক্ষেত্রের কিছু কৌশল বিনিময়ের একটি ভালো সুযোগ।”
সাবেক এই শিক্ষক শুরুতেই তাঁর শিক্ষার্থীদের মধ্যে ব্রাজিলের ২৭টি প্রদেশের ডেটা সংক্রান্ত কাজ সুষমভাবে ভাগ করে দেন।
আমাদের যোগাযোগের প্রধান মাধ্যম ছিল হোয়াটসঅ্যাপ “এবং একটি গুগল শিট টেমপ্লেট। যেখানে তারা শহরের নাম, প্রদেশ, কোভিড-১৯ মৃত্যুর সংখ্যা, আনুষ্ঠানিকভাবে ঘোষিত মৃত্যু সংখ্যা ইত্যাদি বিষয় যোগ করত,” বলেছেন সোয়ারেস।
“গুগল শিটে, শহরের নাম আনুষ্ঠানিক বানানের সঙ্গে মিলে গেলে, টেমপ্লেটটি শহরের কোড বলে দিত। এর সাহায্যে আমরা এই ডেটাগুলো অন্যান্য ডেটাবেজের সঙ্গেও মিলিয়ে দেখতে পেরেছি। যেমন জনসংখ্যা (প্রতি এক লাখে হার হিসেব করার জন্য), মাথাপিছু জিডিপি, শহর বৈশিষ্ট্য ইত্যাদি। এটি আমরা করেছি নানাভাবে ডেটা বিশ্লেষণের সম্ভাবনা তৈরির জন্য।
“মে মাসের শুরুর দিকে, শহরভিত্তিক তালিকা প্রকাশ শুরু করে সরকার। আমরা কিছু সময়ের জন্য তাদের এই ডেটার দিকে নজর রেখে দেখেছি, তাদের সঙ্গে আমাদের সংগ্রহ করা ডেটার অনেক মিল আছে। আমরা তখন থেকে সরকারের শহরভিত্তিক ডেটা সংগ্রহ করা শুরু করি এবং শিক্ষার্থীরা সেগুলো বিশ্লেষণ করে।”
“যেমন, ফ্যাবিও কাজ শুরু করে এসআরএজি কেসগুলোর মাইক্রো ডেটা নিয়ে। পরীক্ষা করা হয়নি এমন কোভিড মৃত্যু শ্রেণিবদ্ধ করা হয় এসআরএজি দিয়ে। মার্চ মাসে, একটি স্বাস্থ্যসেবা গবেষণা প্রতিষ্ঠান খেয়াল করে যে, এসআরএজি কেসের সংখ্যা হঠাৎ করে অনেক বেড়েছে, যা আগের বছরগুলোর গড় সংখ্যার চেয়ে অনেক বেশি।”
শিক্ষার্থীরা খেয়াল করে: এসআরএজি কেসগুলোর সঙ্গে কোভিড-১৯-এর অনেক মিল আছে। এবং বেশিরভাগ শহরেই এসআরএজি কেসগুলো পরীক্ষা করে দেখা হচ্ছিল যে, সেগুলো আসলেই কোভিড-১৯ কিনা।
সোয়ারেস বলেছেন, “সাধারণত পরীক্ষা করে নিশ্চিত না হতে পারলে কোভিড মৃত্যুগুলোকে এসআরএজি মৃত্যু হিসেবে শ্রেণীবদ্ধ করা হয়। ফলে যখন আমাদের আরো বেশি ডেটা নিয়ে কাজ করার সুযোগ তৈরি হয়েছে, তখন এসআরএজি মাইক্রো ডেটা নিয়ে কাজ শুরু করেছে ফ্যাবিও। দেখতে চেয়েছে সেখান থেকে কিছু বের করে আনা যায় কিনা। এই কাজটি উপস্থাপনের জন্য আমরা এসআরএজি ও কোভিড মৃত্যুর একটি টাইম সিরিজ তৈরি করেছিলাম। প্রতিবেদনটি ব্রাজিলিয়ান সংবাদপত্র ফোলয়া ডে সাও পাওলো-তে প্রকাশিত হয়েছে।”
ডেটা বিশ্লেষণ ও ভিজ্যুয়ালাইজেশনের জন্য তারা ব্যবহার করেছেন ডেটার্যাপার, ফ্লোরিশ ও গুগলের ডেটা স্টুডিও। সোয়ারেসের মতে, “এগুলো বিনামূল্যে পাওয়া যায়, সুন্দর ও নান্দনিকভাবে উপস্থাপন করা যায় এবং খুবই সহজে ব্যবহার করা যায়।”
“ডেটার্যাপার ও ফ্লোরিশ দিয়ে সুন্দর চার্ট তৈরি করা যায়। ফ্লোরিশ দিয়ে আমরা চার্টগুলো অ্যানিমেটও করতে পারি। ডেটার্যাপারের ম্যাপগুলো প্রতিদিন ম্যানুয়ালি হালনাগাদ করতে হয়। বার চার্টগুলো হালনাগাদ হয় স্বয়ংক্রিয়ভাবে। শুরুতে আমি গুগল শিটে থাকা ডেটাগুলো, ডেটা স্টুডিওতে নিয়ে কাজ করছিলাম। কিন্তু ১০০ পয়েন্টে এসে এটি ভেঙে যায়। এজন্যই আমি ডেটাগুলো নিয়ে গিয়েছিলাম ডেটার্যাপারে।
“এখন আমি বিগকোয়েরিতে থাকা ডেটা দিয়ে ড্যাশবোর্ড বানানোর জন্য ডেটা স্টুডিও ব্যবহার করি [লাগুম ডেটা ওয়েবসাইট], মাকুইনা দো তেম্পো-তে আছে প্রতিটি প্রদেশের রিপোর্ট করা কোভিড সনাক্ত ও মৃত্যুর তথ্য। আর সাবনোটিফিকো মেট্রো থেকে দেখা হয়: প্রতিদিন, প্রতিটি শহরে কী পরিমাণ এসআরএজি ও কোভিড মৃত্যু হচ্ছে, তার তুলনা।
“শুরুতে আমি ডেটাগুলো তুলে রাখছিলাম একটি গুগল শিটে। কিন্তু এক সময় এর পরিধি অনেক বড় হয়ে যায় এবং আমাকে এটি বিগকোয়েরিতে আপলোড করতে হয়। বিগকোয়েরি, গুগল ক্লাউড সার্ভিসের একটি অংশ এবং এই টুল টাকা দিয়ে কিনতে হয়। আমি এখানে অনেক বড় বড় ডেটাবেজ রাখি। যেমন চাকরি (প্রতিটির জন্য একটি লাইন। ২০১৮ সালে ছিল ৬৮ মিলিয়ন লাইন।) এবং অংশীদার কোম্পানির নামসহ কোম্পানি রেকর্ড (২৮ জিবি)।”
১৫ বছর আগে এই আকারের ডেটা প্রকল্প পরিচালনার কথা চিন্তা করাও কঠিন ছিল।
“২০০৩ সালে ব্রান্ট হিউস্টনের [নাইট প্রফেসর ইন ইনভেস্টিগেটিভ অ্যান্ড এন্টারপ্রাইজ রিপোর্টিং] কাছে অ্যাকসেসের ব্যবহার শেখার সময় ব্রাজিলে এমন প্রকল্পের কথা চিন্তা করা যেত না। সেটি ছিল আবরাজির [ব্রাজিলিয়ান অ্যাসোসিয়েশন অব ইনভেস্টিগেটিভ জার্নালিজম] শুরুর দিকের কথা। আধুনিক সব টুল ও ক্লাউডের বাইরে, ভালো, বিস্তারিত ডেটা জোগাড় করতে পারাটাও ব্রাজিলে অনেক কঠিন ব্যাপার। আমার কাছে এখনো একটি সিডি আছে যেখানে ব্রান্ট আমাকে যুক্তরাষ্ট্রে অভিবাসন সংক্রান্ত কিছু ডেটা দিয়েছিলেন বিশ্লেষণের জন্য। ব্রাজিল থেকে যুক্তরাষ্ট্রে পাড়ি জমানোর ডেটায় কোনো প্যাটার্ন পাওয়া যায় কিনা, তা দেখার জন্য।
“২০০২ সালে, নির্বাচনে দাঁড়ানো প্রার্থীদের সম্পদের ডেটা সংগ্রহ করার জন্য ব্রাজিলিয়ান সংবাদপত্রকে ২৭টি প্রদেশের সবগুলো নির্বাচনী আদালতে রিপোর্টার পাঠাতে হয়েছিল, প্রার্থীদের ঘোষণা করা সম্পদ বিবরণের ফটোকপি জোগাড় করার জন্য। আমিও সেই কাজের অংশ ছিলাম। আমার মনে আছে, ৪০ পাউন্ড ওজনের কাগজপত্র ফটোকপি করার জন্য বাইরে ছুটতে হচ্ছে, কারণ এতোগুলো কপি করার জন্য আদালত প্রস্তুত ছিল না।”
“চার বছর পর, সেই কাজগুলো এবং পরবর্তীতে আরো নানা কাজের পরিণামে এই সব রেকর্ড অনলাইনে তুলে রাখা গেছে এবং প্রতিটি নির্বাচনের আগে সেগুলো সামনে আনা হয়। এবং আরো ছয় বছর পরে, আমরা তথ্য অধিকার আইন পেয়েছি।”
সোয়ারেস শেষ করেছেন এই বলে, “এখানে অনেক কিছুই বদলেছে, এবং তা ভালোর জন্যই।”
লেখাটি প্রথম প্রকাশিত হয়েছিল ইনভেস্টিগেটিভ জার্নালিজম এডুকেশন কনসোর্টিয়াম (আইজেইসি)-র ওয়েবসাইটে। অনুমতি নিয়ে এখানে পুনঃপ্রকাশ করা হলো।
জেল্টার মিরস অর্গানাইজড ক্রাইম অ্যান্ড করাপশন রিপোর্টিং প্রজেক্টের সমন্বয়কারী সম্পাদক। এবং বিশ্ববিদ্যালয়ের সাংবাদিকতা বিভাগের শিক্ষকদের সংগঠন, আইজেইসি-র সদস্য।