
يمكن وصف الطرق الإحصائية المستخدمة في البحث الكمي على أنها إما معلمية Parametric أو غير معلمية Nonparametric. غالبًا ما يُساء فهم هذه المصطلحات ويُعتقد أنها تصف البيانات . في الواقع مصطلح المعلمي واللامعلمي تستخدم لوصف الافتراضات التي تقوم عليها بعض الأساليب الإحصائية. بشكل عام ، إذا تم تطوير طريقة إحصائية باستخدام خصائص توزيع معين (مثل التوزيع الطبيعي او توزيع كاما او الاسي وغيرها الكثير ) ، فهناك افتراضات اساسية يجب الالتزام بها من أجل صحة استخدامها. توصف هذه الطريقة الإحصائية بأنها معلمية Parametric . يشير المصطلح “معلمية ” إلى معلمات التوزيع الإحصائي الأساسي . على سبيل المثال ، تم تطوير اختبار T-test باستخدام نظرية التوزيع الطبيعي ، لذلك لديه افتراض أساسي بأن توزيع متوسط العينة يتبع التوزيع الطبيعي. ولنفترض أنه إذا أخذنا عينات عشوائية متكررة من السكان وتم حساب المتوسط لكل عينة ، ستتبع هذه المتوسطات التوزيع الطبيعي. وبالتالي ، فإن اختبار t هو طريقة معلمية . من المفاهيم الخاطئة الشائعة أن كلمة “معلمي” تشير دائمًا إلى افتراض التوزيع الطبيعي . على الرغم من أنه من التوزيعات الاكثر استخداما للعديد من الإجراءات الإحصائية الأساسية أن تفترض الحالة الطبيعية (لمتوسطات أخذ العينات) ، فإن المصطلح معلمي يشير أيضًا إلى المنهجيات والطرائق التي تفترض أنواعًا أخرى من التوزيعات مثل توزيع ذي الحدين أو توزيع بواسون.
مما سبق نستنتج ان الإحصائيات المعلمية تستند إلى افتراضات حول توزيع السكان التي تم أخذ العينة منها. بالمقابل لا تستند الإحصائيات اللامعلمية إلى افتراضات ، أي أنه يمكن جمع البيانات من عينة لا تتبع توزيعًا محددًا.
في هذه المقالة ، سنبذل قصارى جهدنا لشرح الاختلافات بين النهجين المعلمي وللامعلمي في المنهجية الإحصائية. في واقع الأمر ، يتمثل أحد أهداف هذا العمل في اقتراح نمذجة حدية مناسبة ومرنة ، وتقييم ما إذا كانت أكثر كفاءة وموثوقية من استراتيجية النمذجة غير المعلمية ، أم لا.
باختصار ، تنقسم الأساليب الإحصائية بشكل دقيق إلى عائلتين رئيسيتين: النهج المعلمي ، الذي ينتمي إليه اختبار t المعروف Student Test (على الأقل نسخة العينة الصغيرة) ، والنهج غير المعلمي ، الذي ينتمي إليه أيضًا اختبار ويلكوكسون مان ويتني Wilcoxon-Mann-Whitney أو اختبار مربع كاي chi-square test الذي ينتمي لاختبارات الاستقلالية.
الفرق بين الاحصاءات المعلمية واللامعلمية The difference between parametric and non-parametric statistics
- في الإحصائيات المعلمية ، تُعرّف المعلومات المتعلقة بتوزيع السكان وتستند إلى مجموعة ثابتة من المعلمات. في الإحصائيات اللامعلمية ، المعلومات حول توزيع السكان غير معروفة ، والمعلمات غير ثابتة ، مما يجعل من الضروري اختبار الفرضية للسكان.
- لتقرير ما إذا كنت ستستخدم الإحصائيات المعلمية أو غير المعلمية ، يجب عليك التفكير في عدة معايير حول بيانات العينة والافتراضات ، وتقييم صحة هذه الافتراضات بعناية.
- الاحصاءات اللامعلمية لا تتطلب افتراضات حول شكل توزيع (توزيعات) بيانات السكان ولا تتطلب قياس مستوى الفترة الزمنية.
- يمكن تفسير معلمات نموذج المعلمي في كثير من الأحيان (مما يساعد على فهم وتلخيص البيانات) .
- في النهج المعلمي لا يمكن إجراء بعض الحسابات ، أو لا يمكن إثبات بعض النتائج الرياضية ، دون تحديد بعض أجزاء النموذج بشكل أساسي (على سبيل المثال ، حد الخطأ العشوائي ) ؛
- بالنسبة لمجموعات البيانات الكبيرة حقًا ، غالبًا ما يثبت أن تقنيات المعلمي أكثر دقة من بدائلها غير المعلمية .
- بالنسبة للبيانات ذات الأبعاد العالية ، قد تعاني التقنيات غير المعلمية من عدم الدقة التي تسمى “لعنة الأبعاد” curse of dimensionality ، والتي هي خارج نطاق أعمالنا البحثية الحالية.
الانموذج المعلمي وللامعلمي The Parametric and Nonparametric model
بشكل عام ، ماذا تعني كلمة معلمي للانموذج إلاحصائي؟ إذا كانت X = (x1،..، xn) تشير إلى بعض المتغيرات عند فترات معينة ، فإننا نفترض أنها متغيرات مستقلة لبعض توزيعات الاحتمالات ذات دالة كثافة الاحتمال (p.d.f) لدالة f(X). سيكون النهج معلميا إذا افترضنا أن هذا p.d.f. ينتمي إلى بعض عائلة التوزيعات f(θ) حيث θ عبارة عن متجه من المعلمات ذات بعد d معلمات فرعية ذات قيمة حقيقية ، والقيم المعلمات غير معروفة: d هي بُعد النموذج.

نظرًا لأن تشكيلة ابعاد جميع التوزيعات الممكنة غير محدودة ، فقد تم تقليص مشكلة تقدير f(X ) إلى مشكلة تقدير معلمة ذات أبعاد محدودة: هذا هو الغرض الرئيسي من النهج المعلمي .
وبالتالي ، فإن ميزة النهج المعلمي هي أنه ، بشكل عام ، بمجرد توفر مقدّر مناسب للمعلمة θ ، يمكن تقدير كل كمية محتملة مرتبطة بتوزيع وقت التنفيذ بسهولة إلى حد ما ، بما في ذلك عدم التأكد المرتبط بهذا التقدير ( على الأقل بشكل تقريبي). وبالمقابل ، فإن عيب النهج المعلمي هو أن صحة التحليل الإحصائي اللاحق قد تعتمد على هذا الافتراض بأن التوزيع الحقيقي للمشاهدات يتم انتاجه من تلك العائلة المعلمية :اما في حالة الاعتماد على مجموعة مختلفة من التوزيعات ، عملياً يجب إجراء عملية تصميم المقدرات والاختبارات مرة أخرى ، وقد يستغرق ذلك وقتًا طويلاً وغير فعال.
من ناحية أخرى ، لا يفترض النهج غير المعلمي أي شكل معين للتوزيع الاحتمالي الأساسي للبيانات ، وبالتالي يجب أن يكون التحليل الإحصائي اللاحق فعالاً مهما كان f(X )، أي يجب أن يكون صالحًا لأي نوع من البيانات. هذا يجعل هذا النهج جذابًا للغاية: ومع ذلك ، فإن النتائج الإحصائية الصادرة من هذا النهج غالبًا ما تكون صالحة فقط لحجم العينات الكبيرة بما فيه الكفاية لعينة البيانات ، وعلاوة على ذلك ، فإن تقدير كمية معينة من المعلمات يحتاج إلى أسلوب أو نهج محدد ، دون نظرة شاملة. بالإضافة إلى ذلك ، فإن النهج غير المعلمي عموما معروف في تحقيق نتائج إحصائية أقل كفاءة من تلك الصادرة من نهج معلمي (لحجم عينة نفسها) ؛ سيتم استكشاف هذا في سياق تقييم أداء البرنامج لدينا.
ملاحظة أخيرة: من المفيد أن نتذكر أن الإحصائيات والاحتمالات تقدم أدوات للمساعدة في اتخاذ القرارات (ولكن في النهاية ، المستخدم هو صانع القرار الحقيقي) ، فهي تقدم رؤى حول الصفات الأساسية وغير المعروفة للبيانات الموجودة ، إلى جانب بعض احتمالية الخطأ ، بعض المخاطر ، والتي تكون صالحة فقط في ظل مجموعة محددة من الافتراضات المحددة مسبقاً . إذا لم يتم التحقق من هذه الافتراضات مسبقًا ، أو أخذها في الاعتبار ، فقد تكون المعلومات الناتجة مضللة. تنطبق ملاحظة التحذير هذه على النهج المعلمي (الذي يستخدم أحيانًا دون التحقق من ملاءمة الانموذج المدروس) وكذلك على النهج غير المعلمي (الذي يحتاج أحيانًا إلى عدد كبير جدًا من قيم البيانات ليكون فعالاً ). (1)