সন্দেহজনক ওয়েবসাইটগুলোর নেপথ্যে থাকা ব্যক্তি বা প্রতিষ্ঠানকে শনাক্ত করার বেশ কিছু পদ্ধতি রয়েছে। এদের কিছু সহজ, কিছু জটিল। তবে বিদ্বেষ, প্রতারণা বা অপতথ্য ছড়ানো বেনামী সাইট নিয়ে সফল অনুসন্ধানগুলো সাধারণত কিছু প্রশ্ন দিয়ে শুরু হয়।
সম্প্রতি টেনেসিতে, নিকার২৩ ডেটা জার্নালিজম সম্মেলনে ওয়েবসাইট অনুসন্ধান নিয়ে একটি প্যানেল আলোচনা অনুষ্ঠিত হয়। এতে উপস্থিত ছিলেন কলাম্বিয়া বিশ্ববিদ্যালয়ের টাউ সেন্টার ফর ডিজিটাল জার্নালিজমের সিনিয়র কম্পিউটেশনাল ফেলো প্রি বেঙ্গানি ও দ্য মার্কআপের অনুসন্ধানী ডেটা রিপোর্টার জন কিগান। সেখানে তারা অচেনা ডিজিটাল সমস্যা সমাধানের জন্য কিছু চেনা রিপোর্টিং কৌশল তুলে ধরেন। কোনো ওয়েবসাইটের পিছনে “কে” বা “কারা” আছেন, তা খুঁজে পেতে তাঁরা সেই সাইটের সৃষ্টি ও বিবর্তনকে কেন্দ্র করে কী, কেন, কখন ও কীভাবে প্রশ্নগুলোর ওপর ভর করে এগিয়ে যেতে বলেছেন। তারপর সেই প্রশ্নগুলোর উত্তর জানার উপায় নিয়ে পরীক্ষা নিরীক্ষা চালাতে পরামর্শ দিয়েছেন।
কিছু উত্তর বেশ সহজ। যেমন: একাধিক সাইটে একই ভাষা ব্যবহার করা হয়েছে কিনা, তা জানতে একটি ওয়েবসাইটের টার্মস অব সার্ভিস বা “অ্যাবাউট” পেইজ থেকে টেক্সটের একটি অংশ কপি করে গুগলে সার্চ করুন। তখন দেখতে পাবেন আর কোন কোন সাইট একই টেক্সট ব্যবহার করেছে। অবশ্য কিছু অনুসন্ধানে পাইথন কোডিং প্রয়োজন হয় বা ইন্টারনেট সাবডোমেইন খতিয়ে দেখতে হয়। এই কাজগুলো জটিল এবং এজন্য বার্তাকক্ষে কম্পিউটার বিজ্ঞানে দক্ষ কেউ থাকতে হয়৷ কয়েকটি পদ্ধতি আছে যেগুলো প্রথমে জটিল মনে হবে, কিন্তু আসলে সহজ। যেমন: কোনো ওয়েবসাইটের সোর্স কোড বের করা, কন্ট্রোল-এফ দিয়ে সেখান থেকে সাইট মালিকের স্বতন্ত্র রেভেনিউ কোড খুঁজে বের করা। তারপর একই কোড দিয়ে সার্চ করে দেখা যে, আর কোন কোন সাইট এটি ব্যবহার করছে। (এই কৌশলের বিশদ বিবরণে চোখ রাখুন। এই কৌশলে মূলত দুষ্টু চক্রের লোভকে কাজে লাগিয়ে তাদের পরিচয় সামনে আনা হয়। অনুসন্ধানী রিপোর্টারদের জন্য জিআইজেএনের নির্বাচনী গাইডের ১ম অধ্যায়ে এ বিষয়ে লিখেছেন প্রোপাবলিকার ক্রেইগ সিলভারম্যান।)
সম্প্রতি অ্যামনেস্টি ইন্টারন্যাশনাল সিকিউরিটি ল্যাবের গবেষক ইতিয়েন মেনিয়া, এমন জটিল অনুসন্ধানের প্রাথমিক ধাপ সম্পর্কে ধারণা দিয়েছেন এবং বেশ কিছু দরকারি কৌশল ও পরামর্শ তুলে ধরেছেন৷ তিনি জিআইজেএনের ডিজিটাল ঝুঁকি অনুসন্ধান গাইডের একটি অধ্যায়ের সংক্ষিপ্তসার লিখেছেন, যা পূর্ণাঙ্গরূপে প্রকাশিত হবে সেপ্টেম্বরে, সুইডেনে অনুষ্ঠিতব্য ২০২৩ গ্লোবাল ইনভেস্টিগেটিভ জার্নালিজম কনফারেন্সে।
এ ধরনের অনুসন্ধানের ক্ষেত্রে রিপোর্টাররা সাধারণত চারটি সোর্সে আস্থা রাখেন: অন-পেইজ কন্টেন্ট ও সংযুক্ত সোশ্যাল মিডিয়া; সাবেক কর্মী; ডোমেইন নিবন্ধনের সময় সরবরাহকৃত “হু-ইজ” তথ্য; এবং সেই ডোমেইন সংশ্লিষ্ট ইন্টারনেট অবকাঠামো।
তবে, ইউরোপের কঠোর জিডিপিআর ডেটা প্রাইভেসি নীতিমালা এবং অনেক নিবন্ধনকারীর নাম ও ঠিকানা প্রকাশে অনীহা সহ বেশ কয়েকটি ঘটনায় বিগত পাঁচ বছরে হু-ইজ ডেটা পদ্ধতিটি দুর্বল হয়ে পড়েছে। অবশ্য, অতীতের কোন সময়ে ওয়েবসাইটের মালিকেরা যদি সেসব তথ্য প্রকাশ করে থাকেন, তাহলে রিপোর্টারেরা কখনো কখনো সে সময়ে ফিরে গিয়ে তথ্যগুলো খুঁজেও বের করতে পারেন। তাই বিশেষজ্ঞরা ডোমেইন টুল, রেকর্ডেড ফিউচার ও সিসকো আমব্রেলার মতো বাণিজ্যিক প্ল্যাটফর্মগুলো ব্যবহার করে বা Whoxy.com ও Whoisology.com-এর মতো বিনামূল্যের সেবা ব্যবহার করে সাংবাদিকদেরকে ডোমেইনের পুরনো রেকর্ডগুলো ঘেঁটে দেখার পরামর্শ দেন৷
সাইটগুলো কোথায় ও কীভাবে হোস্ট করা হয় এবং ডোমেইন নেইম সিস্টেম (ডিএনএস) প্রোটোকল বা তথাকথিত “ইন্টারনেট ফোনবুক” নিয়ে আরও গভীর অনুসন্ধান চালানোর মতো নতুন টুলও রয়েছে৷
পুরনো “প্যাসিভ ডিএনএস ডেটা” যে কতটা কাজের সেটিও বলেছেন কিগান ও বেঙ্গানি। তারা ডিএনএসডিবি স্কাউট ও রিস্কআইকিউ নামের দুটি শক্তিশালী টুলের সন্ধান দিয়েছেন যা দিয়ে ডোমেইনের সঙ্গে আইপি অ্যাড্রেসের সম্পর্ক, এবং তার উল্টোটাও, ম্যাপ করা যায়। ২০১০ সালে চালু হওয়া ডিএনএসডিবি হলো প্যাসিভ ডিএনএস তথ্যের এক বিশাল ডেটাবেস। সাইবার অপরাধীরা সাধারণত নিজেদের প্রয়োজনে বিভিন্ন রিসোর্স শেয়ার ও পুনঃব্যবহার করে। এই ওয়েবসাইট সেই সুবিধাটিকেই কাজে লাগায়। ভেরিফাইড সাংবাদিকেরা নিবন্ধন ও এপিআই কি (Key) সংগ্রহের মাধ্যমে এই সাইট বিনা পয়সায় ব্যবহার করতে পারেন। বেঙ্গানি বলেন, “নির্দিষ্ট একটি ডোমেইনে যে আইপি অ্যাড্রেসে ব্যবহার করে, এই প্রক্রিয়ায় সেটি বের করতে পারেন ব্যবহারকারীরা এবং তারপর সেই আইপি অ্যাড্রেসে থাকা অন্যান্য সাইটগুলোও দেখতে পারেন। এগুলোর প্রত্যেকটি স্বাধীনভাবে অনুসন্ধান করা যায়।”
ওয়েবসাইট-অনুসন্ধানে সাম্প্রতিক সাফল্য
বেশিরভাগ ষড়যন্ত্রতাত্ত্বিক “সংবাদ” সাইটই অন্যান্য সাইট থেকে মিথ্যা স্টোরি নিয়ে সেগুলো বার বার শেয়ার করে। এ কারণে, কপি-পেস্ট করা কন্টেন্ট সার্চ করে সহজেই নেটওয়ার্কটিকে খুঁজে বের করে ফেলা যায়। এদের একটি বড় অংশ মৌলিক অপতথ্যমূলক কন্টেন্ট ব্যবহার করে এবং তারা লেখকদের পরিচিতি বা বাইলাইন ছাড়াই সেগুলো প্রকাশ করে৷ মৌলিক কন্টেন্টের গোপন লেখকদের ট্র্যাক করতে কিছু প্রয়োজনীয় কৌশল তুলে ধরেন কিগান। তিনি জানান, যুক্তরাজ্যের ভ্যাক্সিনবিরোধী ও চিকিৎসা বিষয়ক মিথ্যা তথ্য প্রচারকারী সাইট নিয়ে ২০২২ সালে এমন একটি অনুসন্ধান হয়েছিল। সে সময় নিবন্ধের বেনামী স্টাফ বাইলাইনে ক্লিক করে, ওয়াচডগ সাইট লজিক্যালি-এর সাংবাদিকেরা আবিষ্কার করেন যে সাইটের ওয়ার্ডপ্রেস অ্যাকাউন্টের মালিকের একটি আংশিক নাম পপ আপ করছে। এরপর ইন্টারনেট আর্কাইভ সার্চ করে তারা পেইজটির আসল পরিচালনাকারী কোম্পানির নাম বের করেন এবং তারপর হু-ইজ সার্চ করে সেই কোম্পানির নিবন্ধনকারী ব্যক্তিকে খুঁজে পান। তারা দেখতে পান, নিবন্ধনকারীর নামের সঙ্গে লেখকের নামও আংশিক মিলে যায়।
“তাঁরা ভাগ্যগুণে এমন কিছু ডেটা খুঁজে পেয়েছিলেন যা সেই সাইটে থাকার কথা ছিল না,” বলেন কিগান। ”প্রতিবেদকরা বুঝতে পারেন যে সাইটে একটি পিডিএফ রয়েছে এবং সেই ফাইলে যে নাম রয়েছে তার সঙ্গে মেটাডেটায় পাওয়া আদ্যক্ষর মিলে যায়। এটি ব্যবহার করে তারা সেই ব্যক্তির নিয়োগকর্তাকে খুঁজে পান। এছাড়াও, [সাইটের মালিকেরা] অনুদান গ্রহণ করছিলেন এবং এই তথ্যও কাজে এসেছিল। মনে রাখবেন, অর্থ পেতে কে না চায়!”
গোপনীয়, সরকার-সমর্থিত ডোমেইন উন্মোচন করতে বেশ কয়েক মাস ধরে ধাপে ধাপে এগুতে হতে পারে। ইউক্রেনে রুশ আগ্রাসনের দিন কয়েক পর প্রকাশ্যে আসা ফ্যাক্ট-চেকিং সাইট ওয়ারঅনফেকস হলো এর একটি উজ্জল দৃষ্টান্ত। প্রথমত, রাশিয়ার রাষ্ট্রীয় গণমাধ্যমের ব্যাপক প্রসার ও মস্কোর রহস্যময় ঠিকানার মতো খুঁটিনাটি বিষয়ের খোঁজ পেতে, সম্ভাব্য রাষ্ট্রীয় প্রচারাভিযানে জড়িত সাইট চিহ্নিত করতে এবং একটি ক্রিপ্টোকারেন্সি ফোরামের সঙ্গে যোগসূত্র খুঁজে পেতে জার্মান পাবলিক সম্প্রচার কেন্দ্র ডয়চে ভেলের রিপোর্টাররা হু-ইজ, ইন্টারনেট আর্কাইভ, ও স্ক্যামঅ্যাডভাইজারের মতো টুলগুলো ব্যবহার করেছেন। চীনের একটি প্রদেশে অবস্থিত একটি রুশ কনস্যুলেট সহ প্রভাবশালী কূটনৈতিক চ্যানেলগুলো যে দ্রুত সাইটটির প্রচার চালিয়েছিল, তা আবিষ্কারে বেঙ্গানি পরবর্তীতে স্বাধীনভাবে রিস্কআইকিউ ও ক্রাউডট্যাঙ্গল সহ বিভিন্ন টুল ব্যবহার করেন। তিনি বলেছেন, নিবন্ধিত মালিকের নাম খুঁজে পেতে রিপোর্টারদের পুরো এক বছর সময় লেগেছিল।
বেঙ্গানি বলেছেন, “তথ্য সংগ্রহের জন্য কাউকে নিয়ে এক-আধ বার সার্চ করার বদলে ওয়েবসাইটগুলোকে নিয়মিত ট্র্যাক করা জরুরি৷ এমনকি [ওয়েবসাইটের মালিককে] শনাক্ত করতে না পারলেও আপনি অন্তত তাদের উদ্দেশ্য ও সূত্র খুঁজে পেতে পারেন যা আপনাকে পরবর্তী ধাপে এগিয়ে নিতে পারে।”
ওয়েবসাইটের মালিকানা অনুসন্ধানে পথ দেখাবে যেসব প্রশ্ন
- আপাতদৃষ্টিতে সাইটের উদ্দেশ্য কি? কিগান বলেছেন, “জানতে চান: ‘সাইটটি কি বিজ্ঞাপন বা স্ক্যামের মাধ্যমে আয়ের জন্য বানানো হয়েছিল?’। প্রভাব বিস্তারের জন্য? অপপ্রচার চালাতে? সামাজিক আন্দোলন গড়ে তুলতে? এটি কি নকলবাজ বলে মনে হয়?” অর্থই যদি প্রাথমিক অনুপ্রেরণা মনে হয়, তবে তা আপনার অনুসন্ধানে জন্য দারুণ খবর। “কারণ আপনি তাহলে অর্থের গতিপথ অনুসরণ শুরু করে দিতে পারেন। অর্থ প্রাপ্তি বা অর্থপ্রদান সংশ্লিষ্ট কর্মকাণ্ডের ফলে নেপথ্যের ব্যক্তি বা প্রতিষ্ঠানকে শনাক্ত করার ব্যাপক সুযোগ তৈরি হয়,” বলেন তিনি।
- এর কি কোনো নিউজলেটার আছে? বেঙ্গানি উল্লেখ করেছেন, “ইমেইল নিউজলেটারগুলোতে সাধারণত মালিকদের ঠিকানা তালিকাভুক্ত থাকে। যদি থেকে থাকে, তবে তাদের নিউজলেটারে সাইন আপ করুন।”
- সাইটের নাম কি লিঙ্কডইনে পাওয়া যায়? কিগান বলেছেন, “লিঙ্কডইনে ওয়েবসাইটের নাম দিয়ে সার্চ করলে, কখনো কখনো আপনি এমন কাউকে খুঁজে পাবেন যিনি এই সাইটগুলোর কোনো একটিতে কাজ করেছেন। লিঙ্কডইন দারুণ কাজ করে। প্রায়ই এর অ্যালগরিদম প্রাসঙ্গিক অন্যান্য কোম্পানির নাম সুপারিশ করবে – তবে ‘অপ্রত্যাশিত’ কারও কাছে যাওয়ার আগে কোম্পানিটি সম্পর্কে পর্যাপ্ত তথ্য জেনে নিন।”
- এটি কি কোনো ওয়ার্ডপ্রেস সাইট? কোন ফ্রি ওয়ার্ডপ্রেস টেমপ্লেটকে একটুও বদল না করেই কি সাইটটি বানানো হয়েছে? কিগান বলেছেন, “আপনি যদি জানেন যে এটি একটি ওয়ার্ডপ্রেস সাইট, তবে আপনি অনুমান করতে পারেন যে সেটির ইউআরএল-এ একটি নির্দিষ্ট কাঠামো রয়েছে — ইউআরএলে সবসময় একজন অথর থাকে এবং তার নাম দিয়ে আপনি গুগলে ওয়াইল্ডকার্ড সার্চ করতে পারেন। আমি সব সময় যে টুল ব্যবহার করি তা হল বিল্ট উইথ। ‘রিলেশনশিপ’ প্রোফাইলের জন্য তাদের একটি দুর্দান্ত টুল রয়েছে, যা ব্যবহার করে আপনি অন্য ডোমেনের সঙ্গে ইউআরএল শেয়ার করা যেকোনো ডিজিটাল ফরেনসিক মার্কার দেখতে পাবেন। প্রযুক্তি ট্যাবটি একটি প্রোফাইল তুলে ধরবে যা আপনাকে জানাবে, ‘আরে, এ তো ওয়ার্ডপ্রেস বা ইয়োস্ট এসইও প্লাগইন,’ ও অন্যান্য জিনিস ব্যবহার করছে।”
- সময়ের সঙ্গে সঙ্গে সাইটে কেমন পরিবর্তন এসেছে? ওয়েব্যাক মেশিন ও হুইজডটকম এর মতো টুল ব্যবহার করুন। বেঙ্গানির পরামর্শ ছিল, “গুরুত্বপূর্ণ পরিবর্তনের একটি সময়রেখা তৈরির চেষ্টা করুন।”
- সাইটটি কি অর্থপ্রদানের ক্ষেত্রে মাধ্যম হিসেবে পেপ্যাল ব্যবহারের অনুরোধ জানায়? যদি তাই হয়, তবে কিগানের পক্ষ থেকে একটি “দারুণ কৌশল” ব্যবহারের প্রস্তাব ছিল। পেপ্যালের মাধ্যমে অর্থপ্রদানের চূড়ান্ত পর্যায়ে সাইটের মালিকের পরিচয় দেখা যেতে পারে। তিনি ব্যাখ্যা করে বলেছেন, “প্রতারণামূলক টি-শার্ট কোম্পানিগুলো নিয়ে আমি অনুসন্ধান করছিলাম, আর দেখতে পেলাম, পণ্যটি আসলেই অর্ডার করতে বোতামের ডানদিকে গেলে অনেক সময় প্রাপকের ছোট নাম পপ আপ করবে।”
- এটি কি কোনো নির্দিষ্ট গুগল অ্যাডসেন্স বা গুগল অ্যানালিটিক্স ট্যাগ ব্যবহার করে? প্রশ্নবিদ্ধ সাইটের যে কোনো সাদা অংশে রাইট-ক্লিক করুন, “পেইজ সোর্স”-এ ক্লিক করুন আর তারপর সোর্স কোডে এই ট্যাগগুলোর কোনোটি আছে কিনা, তা দেখতে কন্ট্রোল-এফ-এ “UA” বা “Pub” টাইপ করুন। তারপর এই কোডগুলোকে DNSlytics.com ও BuiltWith-এর মতো টুলগুলোতে সার্চ করুন৷ কিগান উল্লেখ করেছেন, “মনে রাখবেন, কেউ কেউ একাধিক সাইটে চলমান বিজ্ঞাপনের জন্য এক জায়গা অর্থ পেতে চায়।”
- সাইট সংশ্লিষ্ট টাইম জোনের কোনো ক্লু বা উল্লেখ আছে কি? পেইজের মালিক বা স্বত্ত্বাধিকারী কোথায় থাকেন আর পেইজটি যে স্থানভিত্তিক বলে দাবি করা হয়, এর বাইরে অন্য কোথাও এর অবস্থান কিনা, এই প্রশ্নের উত্তরে সেই সূত্র পাওয়া যায়।
- অনুসন্ধান করার মতো কোনো মানুষের ছবি কি আছে? কিগান বলেছেন, “ছবিগুলোতে মেটাডেটা থাকতে পারে যা সুস্পষ্টভাবে সামনে আসছে। ছবিটি ডাউনলোড করুন আর আপনার ইমেজ ভিউয়ারে খুলুন এবং মেটাডেটা দেখুন৷ ছবিটি কখন সম্পাদনা করা হয়েছিল, কখন তোলা হয়েছিল – অনেক সময় এমন বিষয়ের তথ্য থাকে – ছবিটি ফোন থেকে তোলা হলে হয়ত এর জিপিএস থাকতে পারে, বিশেষ করে ব্যক্তিগত সাইটে।”
- সাইটটির কি কোনো ফেসবুক পেইজ আছে? এই ফিচারে “খুব সীমিত” ডেটা পাওয়া বলে সতর্ক করে বেঙ্গানি বলেছেন, এই অনুসন্ধানে ফেসবুকের ট্রান্সপারেন্সি টুল আশ্চর্যজনকভাবে কাজে আসতে পারে। তিনি বলেছেন, “একেবারে কিছু না পাওয়ার চেয়ে অন্তত ফেসবুক ট্রান্সপারেন্সি পেইজগুলো ভালো। পেইজটি পরিচালনাকারী সংস্থা এবং পেইজটির অংশীদার সংস্থাগুলোর ঠিকানা ও ফোন নম্বর সেখানে দেখা যাওয়ার কথা।”
- এই কন্টেন্ট কি অন্য কোথাও প্রকাশিত হয়? বেঙ্গানি বলেছেন, “এমন অনেক নিবন্ধ আমরা দেখি, যেগুলো একাধিক ওয়েবসাইটে শেয়ার করা হয়েছে। কিছু ক্ষেত্রে এর সার্চ ইঞ্জিন স্প্যাম, কিছু ক্ষেত্রে এনটিটিগুলো একাধিক সাইট জুড়ে সবকিছু পরিচালনা করছে, বা ডেটা চুরি করছে।”
- এই ডোমেইনে কি কোনো ইমেইল অ্যাডেস নিবন্ধিত ছিল? যদি তাই হয়, তবে তা বৈধ অ্যাড্রেস কিনা, যাচাই করে দেখুন আর এর সঙ্গে কোন অ্যাকাউন্টগুলো যুক্ত, তা দেখুন৷ ইমেইলগুলোর নামে ডেটা চুরির অভিযোগ আছে কিনা তা পরীক্ষা করতে কিগান রিপোর্টারদের হ্যাভ আই বিন পাউন্ডেড সেবাটি ব্যবহারের পরামর্শ দিয়েছেন। আপনি নতুন এপিয়োস রিভার্স ইমেইল সার্চ টুল ব্যবহার করতে পারেন। এই টুলের মাধ্যমে কোনো অ্যাড্রেসের অস্তিত্ব নিশ্চিত করার পাশাপাশি সেই অ্যাড্রেসের সঙ্গে যুক্ত স্কাইপ ও সোশ্যাল মিডিয়া অ্যাকাউন্টগুলোও খুঁজে পেতে পারেন। আপনি hunter.io-এর মাধ্যমে কোনো মালিকের অ্যাড্রেস “অনুমানের” চেষ্টা করতে পারেন।
বেঙ্গানি বলেছেন, “ওয়েবসাইট বা সোশ্যাল মিডিয়া অ্যাকাউন্টে নিবন্ধন ও কোনো অনলাইন উপস্থিতির ফলে কিছু না কিছু ব্যক্তিগত ডিজিটাল তথ্য পড়ে থাকে যা আমরা অনুসরণ করতে পারি। অনেক সময় এই তথ্য সহজ সমাধানের পথ উন্মোচন করে, তবে ক্ষেত্র বিশেষে এমনটি না হলেও এখান থেকে অনেক তথ্য পাওয়া যায় যা পরবর্তীতে প্রতিবেদন তৈরিতে ব্যবহার করা যেতে পারে।”
বেনামী ওয়েবসাইটের পাবলিশারদের ট্র্যাকিংয়ের উন্নত কৌশল সম্পর্কে জানতে গিটহাবে কিগান ও বেঙ্গানির এই চেকলিস্টটি দেখুন।
আরও পড়ুন
ডিজিটাল ঝুঁকি অনুসন্ধান: ডিজিটাল অবকাঠামো
ইনভেস্টিগেটিং ডিজিটাল থ্রেটস: ট্রোলিং ক্যাম্পেইনস
ডিগিং আপ হিডেন ডেটা উইথ দ্য ওয়েব ইন্সপেকটর
রোয়ান ফিলিপ জিআইজেএনের প্রতিবেদক। তিনি দক্ষিণ আফ্রিকার সানডে টাইমস পত্রিকার প্রধান প্রতিবেদক ছিলেন। বিদেশ প্রতিনিধি হিসেবে বিশ্বের ২৪টির বেশি দেশে সংবাদ, রাজনীতি, দুর্নীতি ও সংঘাত নিয়ে রিপোর্ট করেছেন।