في وقت سابق من هذا العام، وبينما كانت كولومبيا تضجُّ بالاحتجاجات والمواجهات المسلّحة والاتّهامات بإساءةِ استخدام الشّرطة للسُّلطة، توافد الصّحفيّون لتغطية الأحداث.
ومع تصاعُد الأزمة، بدأتْ بضعُ وسائل إعلام مستقلّة ومنظّمات لحقوق الإنسان في بناء قواعد بيانات خاصّة بها لتسجيل الوفيات المرتبطة بالاحتجاجات، والتي سجلتها منظمات غير حكومية مختلفة عند أكثر من 70 حالة بحلول أوائل يوليو/تموز. كما بدأوا في تسجيل الادّعاءات المتعلّقة بإساءة استخدام السّلطة والعنف واحتجاز المتظاهرين.
وقد صمّمتْ إحدى هذه القواعد مؤسسة Rutas del Conflicto (سُبُل النّزاع) وهي مؤسّسةٌ إعلاميّةٌ رقميّة تستخدم عادةً تقنيات الاستقصاء وصحافة البيانات لتغطية النزاع المسلح الدّائر منذ 50 عامًا في كولومبيا. وفي وقت سابق من هذا العام، بدأت المجموعة بتغطية العنف المتعلّق بالاحتجاجات، التي اندلعت بسبب إصلاحٍ ضريبيّ مُقترح، لكنها تحوّلت إلى احتجاجاتٍ أوسع مناهضة للحكومة.
بقيادة الصّحفي “أوسكار باررا”، قام فريقٌ من الصحفيين وطلّاب الصحافة ومُطوِّر (developer) ومصمِّم غرافيك ببناء قاعدة بيانات لتسجيل الوفيّات خلال الاحتجاجات التي هزّت مدنًا في جميع أنحاء البلاد.
وتمكن هذا الفريق من إنشاء قاعدة بيانات تمّ التحقُّق منها عن العنف، وذلك بجمع وتأكيد المعلومات المستقاة من الأحداث اليوميّة والتّقارير الصّحفيّة والمنظّمات غير الحكوميّة والمقابلات مع الشهود وأقارب الضّحايا. وقد مكّنهم ذلك من رسم خريطةٍ للأحداث وكشف هويّة الضّحايا، مع تحليل الظّروف المحيطة بوفاتهم وفضح كيف كانت وحشيّة الشّرطة وراء العديد من المُجرِيات.
لم تكن هذه هي المرة الأولى التي ينشئ فيها “باررا” قاعدة بيانات يمكن استخدامها للصحافة. في الواقع، انطلقتْ مؤسّسة Rutas del Conflicto عام 2012 بينما كان يغطّي عمليّة عدالة انتقاليّة قدّمت فيها القوّات شبه العسكريّة السّابقة أدلّةً عن دورها في حرب كولومبيا ضدّ القوّات المسلّحة الثوريّة الكولومبية – الفارك.
أدرك “باررا” أن جلسات الاستماع تكشف في كثيرٍ من الأحيان تفاصيلَ عن المجازر التي قُتل فيها مدنيّون ومقاتلون أعداء. “لذلك، فكّرت أنّه سيكون من الجيّد تجميع كل تلك المعلومات في قاعدة بيانات لمحاولة إنشاء أدوات لرسم الخرائط والجداول الزمنيّة”، كما يقول، مضيفًا أن القصص الفرديّة المتعلّقة بكل ظهورٍ في المحكمة فشلتْ في بناء صورةٍ كاملةٍ لما يحدث كما يمكن أن تبنيها خريطة.
استخدم “باررا” معرفته كمهندس أنظمة (مهنته السابقة) وشغفه بالصّحافة الاستقصائيّة لتدريب مجموعةٍ من الطلاب، وسعى للحصول على تمويلٍ للمرحلة الأولى من Rutas del Conflicto، التي فازت بجائزة صحافة البيانات لعام 2017 لأفضل موقعٍ لصحافة البيانات.
ومنذ ذلك الحين اتّبع الفريق نفس الخطوات لجمع وتنظيم ومعالجة البيانات حول كيفيّة اختفاء ضحايا النّزاع قسرًا في الأنهار في جميع أنحاء البلاد، والعلاقة بين العنف في كولومبيا والنّزاعات على ملكية الأراضي.
تقوم غرف الأخبار في جميع أنحاء العالم ببناء قواعد بياناتٍ خاصّة بها عندما تواجه نقصًا في البيانات الرّسميّة، أو عندما تكون البيانات المتاحة غير موثوقة. وقد أنشأها آخرون كمصدرٍ للإبلاغ أو الاستقصاء أثناء وقوع الأحداث، أو عندما يكون من الضروري التّحقُّق من المعلومات من مصادر مختلفة.
تقول “رومينا كولمان”، وهي خبيرة في صحافة البيانات من الأرجنتين ومحرّرة بيانات أمريكا اللاتينية في مشروع الإبلاغ عن الجريمة المنظّمة والفساد (OCCRP) “إن عدم وجود البيانات التي تحتاجها في متناول اليد ليس سببًا لعدم سرد قصّةٍ تعتقد أنّها قد تكون مفيدةً للجمهور”.
وفي حين أن الصحفيين الاستقصائيين قد يواجهون معلومات بكل الصّيَغ – تقارير PDF، وسجلات ورقية غير مرتّبة، ومقابلات وملاحظات الصحفيين، وملفّات ممسوحة ضوئيًا، ووثائق مكتوبة بخطّ اليد، وأرشيفات قديمة. يمكن تحويلها كلها، بالخبرة المناسبة، إلى قواعد بيانات قابلة للمعالجة.
تعلّمت هذا في عام 2009، عندما عملت على إنشاء قاعدة بيانات مع عضو GIJN Consejo de Redacción (CdR)، وهي رابطة الصّحفيين الاستقصائيين في كولومبيا. أردنا بناء قاعدة بيانات للشّركاء الصحفيين من شأنها أن تساعدهم على الاستقصاء عن الموظّفين العموميين والفساد. في ذلك الوقت، كانت أدواتُ استخراجِ البياناتِ من الوثائقِ نادرةً. كانت صحافة البيانات حديثةً في كولومبيا، ولم نحصل إلّا على معلوماتٍ محدودة في صِيَغٍ رقميّة يمكن التّعامل معها من الحكومة.
لذلك بدأنا نفرّغ كتابيًا مئات الوثائق الورقيّة، كثيرٌ منها مكتوبٌ بخطّ اليد، والتي كان المسؤولون الحكوميون يقرّون فيها بتضارب مصالحهم، وبالجهات المانحة لحملاتهم الانتخابيّة. تجمّع لدينا أكثر من 2 مليون سجلّ بعد عامين، بعد إضافة بياناتٍ أخرى ذات صلة من أكثر من 20 مصدرًا رسميًا. وأدى هذا إلى فضح العديد من التصّرفات السّياسيّة الخاطئة، مثل هذا التّوزيع المُريب للأراضي الذي كشفته مجلّة التّحقيق الرّائدة Semana.
وفي عام 2011، وبينما كانت إدارة البيانات وتحليلها يتقدّمان كأساليب صحافيّة، انضمّت كولومبيا إلى شراكة الحكومة المفتوحة، وهي مبادرةٌ عالمية وقعتها 78 دولة لتحسين الشفافية. وقد مكّنني ذلك أنا وفريقي من مواصلة إنشاء قواعد بيانات لسرد القصص المهمّة. تعمّقت إحدى القصص في الصّلات بين المراقبين المحلّيين (وهم مسؤولون عموميون مكلّفون بالإشراف على عمل رؤساء البلديّات والمحافظين) والأشخاص الذين كان من المفترض أن يراقبوهم. وحلّلت قصّةٌ أخرى منْ قام بتمويل الحملات الانتخابيّة الرئاسيّة وحملات الكونغرس سنة 2018 من خلال مقارنة تقارير المرشّحين بالعقود العامّة وسجلّات الشّركات والبيانات التّاريخيّة للمسؤولين الحكوميين المحليين.
وبينما كان الصّحفيون يبنون قواعد بيانات منذ ثمانينات القرن العشرين، ظهرت في السّنوات الأخيرة تكنولوجيا لاستخراج البيانات من صفحات الويب، وتحويل ملفات PDF أو الملفات الممسوحة ضوئيًا إلى أشكال قابلة للتّحرير، والجمع بين كمّيات كبيرة من البيانات، وأصبحت أكثر سهولة. وقد تلقّى عددٌ متزايدٌ من المراسلين تدريبًا على ما كان يطلق عليه العمل الصحفي المُسند بالحاسوب – المعروف الآن باسم صحافة البيانات – وازداد التّعاون بين الصّحفيين والمطوِّرين أو مهندسي الحاسوب، مما جعل بناء قواعد بيانات للأغراض الصّحفيّة أسهل وأكثر جدوى.
وعلى الصعيد العالمي، أنشأت غرف الأخبار قواعد بيانات للتّحقيق في الأصول المصادَرة من المجرمين في إيطاليا، والوفيّات الناجمة عن الصّعق الكهربائي، واستخدام الشرطة للقوّة في الولايات المتّحدة، فضلاً عن التعاون مع التّحقيقات العابرة للحدود الوطنية. وفي الآونة الأخيرة، قامت مجموعةٌ من الصّحفيين من 12 بلدًا ببناء قاعدة بيانات تتضمّن معلومات لم يسبق تبويبها من قبل، شملت 2460 حالة عنف ضد المدافعين عن الحقوق البيئيّة في أمريكا اللاتينية. ونشرت المجموعة فيما بعد 36 تقريرًا استقصائيًا عن مجموعة البيانات هذه في مشروعٍ خاصّ يسمّى أرض المقاومين.
وعلى الجانب الآخر من العالم، فاز مشروع الإبلاغ عن الجريمة المنظّمة والفساد بجائزة سيغما لعام 2020 عن تحقيقه حول ترويكا لاوندرومات، التي استخدم فيها الفريق أحدث التّقنيات لاستخراج البيانات من أكثر من 1.3 مليون معاملة من مئات السجلات المصرفيّة. كشف هذا العمل كيف يستثمر الأوليغاركيون والسياسيون الرّوس سرّاً ملايينهم غير المشروعة في الخارج، ويغسلون الأموال، ويتهرّبون من الضرائب.
وتمتاز هذه المشاريع بتجميع بياناتٍ لم تكن متاحةً للجمهور أو لم يتمّ تجميعها مركزيًا لسرد القصص التي كان لها أثرٌ كبير، ولكنها لم تكن لتتيسّر لولا قواعد البيانات التي مكّنت الصحفيين من التّعمُّق في القصّة. لكن الصحفيين الاستقصائيين يمكنهم أيضا إنشاء قواعد بيانات على نطاقٍ أصغر وأن يكون لها أثرٌ هائل. ولدينا هنا دليلٌ يشرح خطوة بخطوة كيفية بناء قواعد البيانات للتحقيقات.
1 – استعدّ
– استكشف المستندات التي ستستخرج منها البيانات. هل هنالك أنماط مكررة؟ هذه العناصر المتكرّرة ستعطيك فكرةً عن طريقة بناء قاعدة بياناتك. إذا كنت تبدأ من الصّفر وكنت ستحصل على السجلّات من المقابلات والتّقارير التقليدية، حلِّلْ الحالات المتشابهة أو القصص لإيجاد أرضيّةٍ مشتركة. قد يكون من المفيد التحدُّث مع الخبراء في مرحلة الاستكشاف هذه.
– حدد نطاق البيانات التي ستجمعها. ما هي الفترة التي ستغطّيها؟ ما هي الحالات التي ستشملها، وما هي الحالات التي ستستبعدها؟ (وهذا يتطلّب معايير واضحة ومحدّدة للغاية). هل سيكون هنالك حدٌّ لعدد السجلّات التي ستعالجها؟ موارد مشروعك – الوقت والفريق والتّمويل والتكنولوجيا وما إلى ذلك – ستساعدك على الإجابة على هذه الأسئلة.
– أعدّ قائمة بالأسئلة التي تريد الإجابة عليها أثناء التّحقيق. وهذا سوف يوجِّه تصميمَ قاعدةِ البيانات.
– شجِّع العمل الجماعي، وخاصة في هذه المرحلة الأوّليّة. المناقشات بين الزملاء تجعل هذه المراحل الحاسمة الأولى أسهل وتقوّي عملك. في الواقع، كانت هذه هي الطريقة التي بدأ بها مشروع “أرض المقاومين”: تمّ تشكيل قاعدة البيانات والتّحقيق أثناء ورش عملٍ للصّحافة الاستقصائيّة.
2 – صمِّم وطوِّر قاعدة البيانات
– ابدأ بتحديد ما سيكون عليه كل سجل (صف):الحالات والأشخاص والأماكن والمنتجات والأحداث والبلدان والمعاملات إلخ…
– ثم ضع قائمة بالعناصر التي قد تساعد في تحديد كلّ سجل: ستكون هذه الحقول (أعمدة). على سبيل المثال، إذا كان كل صفٍّ شخصًا، فقد تكون الحقول هي “الاسم”، و”رقم الهوية”، و”العمر”، و”الموقع” و”المهنة” إلخ…
– حدّد مفتاحًا للوصول لكلّ سجل. أرقام التّعريف (عند توفرها) أفضل من الأسماء. يمكنك أيضا اختراع رموز عن طريق الجمع بين جانبين أو ثلاثة تجعل كلّ سجلٍ فريدًا من نوعها. سيكون هذا المفتاح ضروريًا إذا كنت بحاجة إلى التّحقُّق من المعلومة بالرّجوع إلى مجموعتي بيانات أو أكثر.
– وإلى جانب حقول المُعرِّف، أدرج ملاحظات أخرى لتذكر فيها التّفاصيل – عادةً ما تكون الفقرات القصيرة مفيدةً للسرد – وغيرها مفيدًا للتّصنيف، مثل تلك التي تشير إلى الخصائص المشتركة والتي تبيّن الفئات. بالنسبة لحقول الفئة، من المفيد التفكير في القصة التي قد تخرج من كلّ واحدة من هذه الفئات. مثلاً، قد تخصص عمودًا لـ “العرق” لتحليل ما إذا كان هناك نمطٌ من العنصرية في مجموعةِ بياناتٍ معيّنة.
– التّوحيد أمرٌ بالغ الأهميّة. لذلك، استخدم تكوينات التّحقُّق للتأكُّد من كتابة الأرقام كأرقام، والتّواريخ بالتّنسيق الصحيح، وأن تتم تهجئة الفئات دائمًا بنفس الطّريقة. قدر الإمكان، اجعل معظم الحقول اختياراً من متعدد بدلاً من الأسئلة المفتوحة.
– قم بتضمين حقول لتعرفَ من قام بإدخال كلِّ معلومةٍ وما هو المصدر الأصلي (ضع الرّابط أيضًا). سيكون هذا مفيدًا لاحقًا إذا كنت بحاجة إلى التّحقُّق من أيٍّ من البيانات.
– حاول ألّا تبالغ في عدد الحقول. لا تنشئ إلا الحقول التي ستكون مفيدةً لتحقيقك، وكذلك لتحليل البيانات، وتلك التي سيتمكّن فريقك من تعبئتها.
– قد تحتاج قاعدةُ بياناتك إلى أكثر من جدول واحد، اعتمادًا على درجةِ تعقيدِ الموضوع والعلاقات بين العناصر المعنيّة.
– تأكّد من أن تصميمَ قاعدة البيانات سهلُ الاستخدام لكلّ المعنيين بالمشروع، بغضّ النّظر عن درجة إلمامهم بالتكنولوجيا. يقول “بول رادو”، المؤسّس المشارك ورئيس قسم الابتكار في مشروع الإبلاغ عن الجريمة المنظّمة والفساد: “يجب أن تكون أداةً مبنيّةً خصيصًا للصحفيين ومع الصّحفيين”.
– اجعل قاعدة البيانات قابلةً للتّطوير: قد يكون تصميمك الخطوةَ الأولى لمشروعٍ أكبر في المستقبل، قد تطوّره أنت وفريقك أو قد يطوّره آخرون.
أجرِ الاختبارات مراراً وتكرارًا
– أجرِ اختبارًا تجريبيًا لقاعدة البيانات. قم بتعبئة بعض السجلّات لمعرفة ما إذا كانت تعمل بالطّريقة التي تتوقّعها ولتقيّم ما إذا كانت ستكون مفيدةً للقصص التي تريد العمل عليها. هنالك طريقةٌ جيّدة لتقدير المدّة التي قد يستغرقها المشروع: قِس واحسبْ متوسط الوقت الذي يستغرقه إضافة سجلٍ جديد، والتّدقيق، ثم تأكيد المعلومات.
– ضع قائمة من الأسئلة التي تبدأ بـ “ماذا لو” لتحليل العقبات المحتملة أو سيناريوهات الخطأ وتحديد طريقة التّعامل معها.
– تقييم موثوقيّة واتّساق الحقول المهمّة. إذا كانت لديك مصادر مختلفة تقول أشياء مختلفة – وهو أمر شائعٌ مع الأرقام أو التّواريخ – قد ترغب في نقل المعلومات إلى عمودِ تفاصيل حيث يمكنك وصف الخلاف بدلاً من أن تقرر بشكلٍ عشوائيّ منْ يقول الحقيقة.
4 – املَأ قاعدة البيانات
– طبّق ما تتعلمه في عمليّة الاختبار هذه لتقديم التّدريب العملي للمراسلين الذين سيقومون بجمع المعلومات في قاعدة البيانات وإدخالها وتحليلها. تأكّد من أن الجميع يفهم المفاهيم والفئات بنفس الطّريقة.
– استخدم أدوات التّخزين التّعاونيّة، بحيث لا يعتمد الوصول على شخصٍ واحد فقط.
– قسِّم البيانات باستخدام الفئات التي قمت بتحديدها في مرحلة التّصميم بحيث تكون القواعد واضحة حول منْ يقوم بجمع المعلومات وكيفية تجنُّب الازدواجية.
– إذا كنت بحاجة إلى كشط البيانات من الإنترنت أو من الوثائق النّصّية، ركّز جهودك على ما هو أكثر أهميّة لتحقيقك، وما سيحدد الزاوية التي ستركز عليها قصصك. ففي مشروع “ترويكا”، على سبيل المثال، كان تحديد الغرض من المعاملات أمرًا أساسيًا.
– إذا كانت كمية البيانات الموجودة لديك كبيرة بحيث لا تستطيع التّعامل معها، فكّر في التّعاقد مع محترف خارجي أو شركة خارجية لتفريغ الوثائق كتابيًا في قاعدة البيانات تم تصميمها مسبقًا مع غرفة الأخبار الخاصّة بك.
5 – التّدقيق وفحص الحقائق
– بناء قاعدة البيانات ليس إلا الخطوة الأولى للتّحقيق. قبل تحليل البيانات واستخلاص الاستنتاجات، عليك أن تتأكد منها من المصادر الأصلية، سواءٌ راجعتَ الوثائق أو الشخصيّات الرّئيسية في القصّة. ويشرح “بارا” عن أحد مشاريعه مع “سبل النّزاع” قائلًا: “لقد نقلنا بياناتنا إلى البلديات التي وقعت فيها المجازر حتى يتمكّن النّاجون من تصحيح الأخطاء التي كانت وسائل الإعلام وأشخاصٌ آخرون يروونها لسنوات”.
– حدّدْ نوعَ التّدقيق الذي ستجريه، والذي سيختلف وفقًا لنطاق مشروعك. يمكنك التّحقُّق من السجلّات واحدًا واحدًا عن طريق مقارنتها مع الوثائق الأصليّة أو يمكنك إجراء عمليات فحص عشوائية، ولكن يجب أن تغطي عددًا كبيرًا من السجلّات في قاعدة البيانات. وفي كلتا الحالتين، لا ينبغي أن يكون الشّخص الذي يراجع البيانات هو الشّخص الذي أدخلها.
– ما الذي يجب أن تبحث عنه أثناء التّدقيق؟ الأخطاء المطبعيّة والأرقام والتّواريخ والسجلّات المكرّرة التي لا تستوفي المعايير.
– فكرتان لمراجعة الأرقام: اجعلْ النّظام يجمع المجاميع أتوتوماتيكيًا وقارنها بالمجاميع الموجودة في الوثائق الأصليّة، وافرز البيانات للعثور على القيم المتطرّفة (الأرقام الكبيرة جدًا أو الصّغيرة جدًا وقد تكون نتيجة خطأ).
– لن تكون قاعدة البيانات جاهزة للاستخدام حتى تمر بما يلي: فحص الحقائق، وتدقيق البيانات، ومواجهات المصادر الشخصيّة، والمراجعة القانونية.
برمجيات
كصحفي، لا تحتاج إلى أن تصبح مطوِّر أنظمة للعمل على مشروعِ قاعدةِ بيانات. بدلاً من ذلك، أشْرِك شخصًا يتمتّع بهذه الخبرة في فريقك واعمل في شراكة. قد تكون قائمة الأدوات هذه مفيدة:
– تطبيقات لإنشاء نموذج ويب من شأنها أن تساعد الصحفيين في ملء قاعدة البيانات: Google Forms، وNode.js، و Django، و Flask.
– لتخزين قاعدة البيانات: MongoDB Atlasأو Google’s Firebase
– لهيكلة ومعالجة البيانات: Python (التي يمكن توصيلها بخيارات التخزين المذكورة أعلاه)، StackPostgreSQL ،ELK،و .Filemaker
– لاستخراج البيانات وتحويل ملفات PDF Wondershare Pdf Converter Pro، محول مستندات Google الأساسي، iLovePDF، Smallpdf، Tabula ، Import.io.
– بالطبع يمكنك دائمًا تنزيل البيانات من نظام قاعدة البيانات والعمل عليها باستخدام جداول بيانات Excel أو Google. يمكن أن يكون البدء بغوغل أو إكسل هو الخيار الأفضل للمشاريع الصغيرة.
التّوصيات والنّصائح النّهائية
– الأمن قضيّةٌ مهمّة في هذا النّوع من المشاريع، لذلك استخدمْ الاتّصالات المشفّرة، والنّسخ الاحتياطيّة من البيانات، وخذ سلامتك الشّخصيّة بعين الاعتبار.
– تعلّم كيفية استخدام Excel، ولكن تعاونْ أيضًا مع علماء ومطوّري بيانات.
– اطّلعْ على الأدوات التي يمكن أن تجعل المهمة أسهل: أدوات لكشط البيانات، والنماذج الرّقميّة لملء قاعدة البيانات، وأدوات تحويل ملفات الـ PDF، والمسح الضّوئي باستخدام OCR (التّعرُّف البصري على الأحرف)، ومعالجة النّصوص الضخمة. في مشروع الإبلاغ عن الجريمة المنظّمة والفساد، أنشأوا Aleph، وهي منصّة تقوم بجميع هذه المهام تقريبًا؛ فالمنصة تسهّل الوصول والبحث والكتابة الصوتية وتصفُّح أعداد كبيرة من السجلات التي تحتوي وثائق متعددة التنسيقات (الفورمات).
– نظراً إلى أن هذه المبادرات تتطلّب عادةً فرقًا كبيرة، قرِّرْ منْ سيكون قائد المشروع، وفكّر بترشيحات للتعاون في مجال التّحقيق.
– أطْلِع جمهورك على المنهجية والمصادر، في حال كانت بروتوكولات السلامة والأمان تسمح بذلك. أظْهِر عيّنةً من الوثائق الأصليّة التي أنشأتَ قاعدةَ البيانات منها لبناء المصداقيّة.
– انشر معلومات الاتّصال بك مع التّحقيق حتى يتمكّن القرّاء من أرسال أسئلتهم أو ملاحظاتهم إن رأوا خطأً في قاعدة البيانات.
ميريام فوريرو أريزا صحفيّة استقصائيّة وصحفيّة بيانات كولومبيّة مستقلّة نشرت أعمالها لدى Viceو Colombiacheck, و El Espectador. تمتدّ خبرتها لأكثر من عشرة سنوات في التحقيقات التّعاونيّة وتحليل البيانات والتقديم المرئي للبيانات. شاركتْ في تأليف الدليل الإيبيري – الأمريكي لصحافة البيانات.