من السهل إساءة فهم وإساءة استخدام أحد المصطلحات الأكثر شيوعًا – وأهمية – في البحث الأكاديمي: الأهمية الإحصائية. لقد أنشأنا ورقة النصائح هذه لمساعدة الصحفيين على تجنب بعض الأخطاء الأكثر شيوعًا ، والتي يرتكبها حتى الباحثون المدربون في بعض الأحيان.
عندما يحلل العلماء البيانات ، فإنهم يبحثون عن الأنماط والعلاقات بين المتغيرات التي يدرسونها. على سبيل المثال ، قد ينظرون إلى البيانات المتعلقة بحوادث الملاعب لمعرفة ما إذا كان الأطفال ذوو الخصائص المعينة أكثر عرضة من غيرهم للإصابة بإصابات خطيرة. سيتضمن التحليل الإحصائي عالي الجودة حسابات منفصلة يستخدمها الباحثون لتحديد الدلالة الإحصائية ، وهو شكل من أشكال الأدلة التي تشير إلى مدى اتساق البيانات مع فرضية البحث.
الأهمية الإحصائية هي مفهوم تقني للغاية ودقيق، ولكن يجب أن يكون لدى الصحفيين الذين يغطون الأبحاث فهم أساسي لما تمثله. قام الباحثان الصحيان ستيفن تيني وإبراهيم عبد الجواد بتعريف الدلالة الإحصائية على النحو التالي: “في العلوم ، لا يمكن للباحثين أبدًا إثبات أي بيان لأن هناك بدائل لا حصر لها حول سبب حدوث النتيجة. يمكنهم فقط محاولة دحض فرضية محددة”.
يحاول الباحثون دحض ما يسمى بالفرضية الصفرية، والتي هي “عادة البيان العكسي للفرضية”، كما كتب تيني وعبد الجواد. تشير الدلالة الإحصائية إلى مدى عدم اتساق البيانات التي يتم فحصها مع الفرضية الصفرية.
إذا افترض الباحثون الذين يدرسون حوادث الملاعب أن الأطفال دون سن الخامسة يعانون من إصابات أكثر خطورة من الأطفال الأكبر سنًا ، فقد تكون الفرضية الصفرية هي أنه لا توجد علاقة بين عمر الطفل وإصابات الملعب. إذا كشف التحليل الإحصائي عن وجود علاقة بين المتغيرين ، وحدد الباحثون أن هذه العلاقة ذات دلالة إحصائية ، فإن البيانات لا تتفق مع فرضية العدم.
ولكي نكون واضحين، فإن الدلالة الإحصائية هي دليل يستخدم لتحديد ما إذا كان سيتم رفض الفرضية الصفرية. فالحصول على نتيجة ذات دلالة إحصائية لا يثبت أي شيء.
فيما يلي بعض الأشياء الأخرى التي يجب أن يعرفها الصحفيون عن الأهمية الإحصائية قبل الإبلاغ عن الأبحاث الأكاديمية:
1 – في البحث الأكاديمي، مهم لا يساوي مهم
في بعض الأحيان ، يفترض الصحفيون خطأً أن نتائج الأبحاث الموصوفة بأنها “مهمة” أو جديرة بالملاحظة – جديرة بالنشر. هذا عادة غير صحيح. للتأكيد، عندما يصف الباحثون النتيجة بأنها “ذات دلالة إحصائية”، أو ببساطة “مهمة”، فإنهم يشيرون إلى مدى اتساق البيانات مع فرضيتهم البحثية.
تجدر الإشارة إلى أن النتيجة يمكن أن تكون ذات دلالة إحصائية ولكن ليس لها أهمية أي أهمية عملية تذكر أو معدومة. لنفترض أن الباحثين خلصوا إلى أن عقارًا جديدًا يقلل بشكل كبير من آلام الأسنان ، ولكن لبضع دقائق فقط. أو أن الطلاب الذين يكملون برنامجًا تعليميًا باهظ الثمن يحصلون على درجات أعلى في امتحان القبول في الكلية – ولكن فقط نقطتين إضافيتين ، في المتوسط. على الرغم من أن هذه النتائج قد تكون مهمة بالمعنى الرياضي ، إلا أنها ليست ذات مغزى كبير في العالم الحقيقي.
2 – يمكن للباحثين التلاعب بالعملية لقياس الأهمية الإحصائية
يستخدم الباحثون برامج متطورة لتحليل البيانات. لكل نمط أو علاقة يتم اكتشافها في البيانات – على سبيل المثال ، يزداد متغير واحد مع انخفاض آخر – يقوم البرنامج بحساب ما يعرف باسم قيمة الاحتمال ، أو قيمة p.
تتراوح قيم P من 0 إلى 1. إذا كانت قيمة p تقع تحت عتبة معينة، فإن الباحثين يعتبرون النمط أو العلاقة ذات دلالة إحصائية. إذا كانت قيمة p أكبر من القطع ، فإن هذا النمط أو العلاقة ليست ذات دلالة إحصائية. هذا هو السبب في أن الباحثين يأملون في انخفاض قيم p.
بشكل عام ، تعتبر قيم p الأصغر من 0.05 ذات دلالة إحصائية.
“القيم P هي حارس البوابة ذات الأهمية الإحصائية” ، كتبت الكاتبة العلمية ريجينا نوزو ، أستاذة الإحصاء في جامعة غالوديت في واشنطن العاصمة ، في ورقة لها، نصائح لتوصيل الأهمية الإحصائية.
وأضافت: “ما هو الأهم الذي يجب أخذه في الاعتبار؟ أننا نستخدم قيم P لتنبيهنا إلى نتائج البيانات المفاجئة، وليس لإعطاء إجابة نهائية على أي شيء”.
يجب أن يفهم الصحفيون أن قيم P ليست احتمال أن تكون الفرضية صحيحة. لا تعكس قيم P أيضًا احتمال أن تكون العلاقات في البيانات قيد الدراسة نتيجة للصدفة. حذرت الجمعية الإحصائية الأمريكية من تكرار هذه الأخطاء وغيرها في بيانها حول الدلالة الإحصائية والقيم P.
ويمكن التلاعب بقيم p. إذ أن أحد أشكال التلاعب بقرصنة P هو، عندما يقوم الباحث “بتحليل البيانات باستمرار، بطرق مختلفة، حتى يتم الحصول على نتيجة ذات دلالة إحصائية” ، كما أوضح الطبيب النفسي شيتارانجان أندرادي ، وهو أستاذ كبير في المعهد الوطني للصحة العقلية والعلوم العصبية في الهند ، في ورقة بحثية عام 2021 في مجلة الطب النفسي السريري.
وأضاف أن “التحليل يتوقف إما عند الحصول على نتيجة مهمة أو عندما ينفد الباحث من الخيارات”.
تشمل قرصنة P ما يلي:
– إيقاف دراسة أو تجربة لفحص البيانات ثم اتخاذ قرار بشأن جمع المزيد.
– جمع البيانات بعد الانتهاء من الدراسة أو التجربة، بهدف تغيير النتيجة.
– تأجيل القرارات التي يمكن أن تؤثر على الحسابات، مثل ما إذا كان يجب تضمين القيم المتطرفة ، إلى ما بعد تحليل البيانات.
وكمثال على ذلك في العالم الحقيقي، نشرت العديد من وسائل الإعلام تقارير عن المشاكل التي وجدت في الدراسات التي أجراها الباحث في جامعة كورنيل براين وانسينك، الذي أعلن تقاعده بعد فترة وجيزة من قيام مجلة JAMA، وهي المجلة الرئيسية لجمعية الأدوية الأمريكية، وقامت مجلتان تابعتان لها بسحب ست من أوراقه البحثية في عام 2018.
وصفت ستيفاني لي، وهي مراسلة علمية في BuzzFeed News، رسائل البريد الإلكتروني بين Wansink والمتعاونين معه في Cornell Food and Brand Lab ، مما يدل على أنهم “تناقشوا وحتى مزحوا حول استخراج مجموعات البيانات بشكل شامل للحصول على نتائج مثيرة للإعجاب”.
3 – يواجه الباحثون ضغوطا شديدة لتحقيق نتائج ذات دلالة إحصائية
يبني الباحثون حياتهم المهنية إلى حد كبير على عدد المرات التي يتم فيها نشر أعمالهم، ومكانة المجلات الأكاديمية التي تنشرها. “‘النشر أو الهلاك’ هو وشم في ذهن كل أكاديمي” ، كتب إيون فاين ، أستاذ علم النفس في جامعة واشنطن ، وأليسيا شين ، طالبة الدكتوراه هناك ، في مقال مارس 2018 في المحادثة. “سواء أحببت ذلك أو أبغضته، فإن النشر في المجلات رفيعة المستوى هو المسار السريع للمناصب في الجامعات المرموقة مع زملاء لامعين وموارد سخية وجوائز مشهورة وتمويل وفير للمنح.”
نظرا لأن المجلات الأكاديمية غالبا ما تعطي الأولوية للبحوث ذات النتائج التي تحتوي على الأهمية الإحصائية، غالبا ما يركز الباحثون جهودهم في هذا الاتجاه. تشير دراسات متعددة إلى أن المجلات أكثر عرضة لنشر أوراق تحتوي على نتائج ذات دلالة إحصائية.
“من الموثق جيدًا أن الأهمية الإحصائية غالبا ما يساء فهمها وتفسيرها من قبل الباحثين الذين يعتمدون عليها.” – أساتذة جامعة جيلف جيفري سبنس وديفيد ستانلي
على سبيل المثال، وجدت ورقة بحثية نشرت في مجلة Science في عام 2014 “علاقة قوية بين نتائج الدراسة وما إذا كانت قد نشرت”. ومن بين 221 ورقة بحثية تم فحصها، تم نشر حوالي نصفها. تم نشر 20٪ فقط من الدراسات دون نتائج ذات دلالة إحصائية.
وعلم المؤلفون أن معظم الدراسات التي لم تسفر عن نتائج ذات دلالة إحصائية لم يتم كتابة نسخة منها حتى، لأن الباحثين، الذين توقعوا أن نتائجهم لن تنشر، تخلوا عن عملهم.
“عندما يفشل الباحثون في العثور على نتيجة ذات دلالة إحصائية ، غالبًا ما يتم التعامل معها على أنها فشل”، كتب الكاتب العلمي جون بروك في مقال عام 2019 نُشر في Nature Index. “من الصعب نشر النتائج غير المهمة في المجلات العلمية ، ونتيجة لذلك ، غالبًا ما يختار الباحثون عدم تقديمها للنشر”.
4 – كثير من الناس – حتى الباحثين – يرتكبون أخطاء تفسر الأهمية الإحصائية لغير العلماء
كتب جيفري سبنس وديفيد ستانلي، الأستاذان المشاركان في علم النفس بجامعة جيلف في كندا ، في مجلة Frontiers in Psychology: “مع العديد من الجوانب الفنية، فإن اختبار الأهمية الإحصائية ليس جاهزًا بطبيعته للاستهلاك العام”.
“إن الفهم الصحيح للتعريفات الصحيحة تقنيًا يمثل تحديًا حتى بالنسبة للباحثين المدربين، حيث أنه من الموثق جيدًا أن الأهمية الإحصائية غالبًا ما يساء فهمها وتفسيرها من قبل الباحثين الذين يعتمدون عليها.”
أشار سبنس وستانلي إلى ثلاثة تفسيرات خاطئة شائعة، والتي يجب على الصحفيين البحث عنها وتجنبها. ويلاحظون أن الدلالة الإحصائية لا تعني:
– هناك احتمال ضئيل بأن تكون النتيجة بسبب الصدفة”.
– “هناك فرصة أقل من 5٪ أن تكون فرضية العدم صحيحة.”
– “هناك فرصة بنسبة 95٪ للعثور على نفس النتيجة في النسخ المتماثل.”
يقدم سبنس وستانلي اقتراحين لوصف الأهمية الإحصائية. على الرغم من أن كلاهما موجز، إلا أن العديد من الصحفيين (أو محرريهم) قد يعتبرونهما غامضَين للغاية بحيث لا يمكن استخدامهما في القصص الإخبارية.
إذا كانت جميع نتائج الدراسة مهمة ، اقترح سبنس وستانلي الكتابة إما:
– “كانت جميع النتائج ذات دلالة إحصائية (ما يشير إلى أن التأثيرات الحقيقية قد لا تكون صفرًا).”
– “كانت جميع النتائج ذات دلالة إحصائية (مما يشير إلى أن هناك سببًا للشك في أن التأثيرات الحقيقية هي صفر)”.
5 – ناقش الأكاديميون منذ فترة طويلة كيفية إعادة التفكير في تأثير الدلالة الإحصائية
كتب العلماء عن المشاكل المرتبطة بتحديد الأهمية الإحصائية والإبلاغ عنها لعقود. في عام 2019 ، نشرت المجلة الأكاديمية Nature رسالة موقعة من قبل أكثر من 800 باحث وغيرهم من المهنيين من المجالات التي تعتمد على النمذجة الإحصائية ، والتي دعت إلى “التخلي عن مفهوم الدلالة الإحصائية بالكامل”.
وفي العام نفسه، نشرت مجلة The American Statistician، وهي مجلة تابعة للجمعية الإحصائية الأمريكية، كتاب “الاستدلال الإحصائي في القرن ال21: عالم ما وراء 0.05 — وهو إصدار خاص يضم 43 بحثًا مخصصًا لهذه القضية. يقترح الكثيرون بدائل لاستخدام قيم p وعتبات معينة لاختبار الدلالة الإحصائية.
“بينما نغامر في هذا الطريق، سنبدأ في رؤية عدد أقل من الإنذارات الكاذبة، وعدد أقل من الاكتشافات التي تم تجاهلها، وتطوير استراتيجيات إحصائية أكثر تخصيصًا”، كتب ثلاثة باحثين في افتتاحية تظهر على الصفحة الأولى من القضية: “سيكون الباحثون أحرارًا في توصيل جميع النتائج التي توصلوا إليها، مع العلم أن عملهم يجب أن يحكم عليه من خلال جودة علومهم وتواصلها الفعال، وليس من خلال قيمهم p.
وقد جادل جون يوانيديس، أستاذ الطب في جامعة ستانفورد ونائب رئيس رابطة الأطباء الأمريكيين، ضد التخلي عن هذه العملية. يمكن أن توفر قيم P والدلالة الإحصائية معلومات قيمة عند استخدامها وتفسيرها بشكل صحيح، كما كتب في رسالة عام 2019 المنشورة في JAMA. وهو يعترف بأن هناك حاجة إلى تحسينات – على سبيل المثال ، مرشحات أفضل و “أقل قابلية للعب” لقياس الأهمية. كما أشار إلى أن “الحساب الإحصائي للقوى العاملة العلمية يتطلب تحسينا”.
أكد الأستاذان ديبورا مايو من جامعة فرجينيا للتكنولوجيا وديفيد هاند من إمبريال كوليدج لندن أن “التوصيات الأخيرة لاستبدال أو التخلي عن أو تقاعد الأهمية الإحصائية تقوض الوظيفة المركزية للإحصاء في العلوم”. بدلًا من ذلك، يحتاج الباحثون إلى الدعوة إلى إساءة الاستخدام وتجنبها، كما كتبوا في ورقتهم البحثية في مايو 2022، الأهمية الإحصائية ونقادها: ممارسة العلوم الضارة ، أم الممارسة العلمية الضارة؟
وكتبوا: “حقيقة أن الأداة يمكن أن يساء فهمها وإساءة استخدامها ليست مبررًا كافيًا للتخلص من هذه الأداة”.
تم نشر هذا المنشور في الأصل بواسطة The Journalist’s Resource ويتم إعادة طباعته هنا عبر ترخيص المشاع الإبداعي الخاص به.
موارد إضافية:
تفسير البيانات: نصائح للتأكد من أنك تعرف كيفية قراءة الأرقام
أفضل 10 مشاريع لصحافة البيانات لعام 2021
دليل الشبكة العالمية لمصادر صحافة البيانات
دينيس ماري أوردواي: هي مديرة تحرير The Journalist’s Resource التي انضمت إليها في عام 2015 بعد أن عملت كمراسلة للصحف والمحطات الإذاعية في الولايات المتحدة وأمريكا الوسطى. ظهرت أعمالها في USA TODAY و The New York Times و The Washington Post. كانت مرشحة لنهائيات جائزة بوليتزر في عام 2013 وزميلة هارفارد نيمان 2014-2015.