الإحصاء عبارة عن مجموعة من الأساليب المستخدمة لتحليل البيانات. الإحصاء موجود في جميع مجالات العلم التي تشمل جمع البيانات ومعالجتها وفرزها ، بالنظر إلى البصيرة لظاهرة معينة وإمكانية استنتاج نتائج جديدة محتملة من تلك المعرفة. أحد أهداف الإحصائيات هو استخراج المعلومات من البيانات للحصول على فهم أفضل للمواقف التي تمثلها. وبالتالي ، يمكن اعتبار الإحصائيات علم التعلم من البيانات.
حاليًا ، تسببت القدرة التنافسية العالية في تقنيات البحث والأسواق في سباق مستمر للحصول على المعلومات. هذا اتجاه متنامٍ ولا رجوع فيه. يعد التعلم من البيانات أحد أهم تحديات عصر المعلومات الذي نعيش فيه. بشكل عام ، يمكننا القول أن الإحصاء المبني على نظرية الاحتمال ، يوفر تقنيات وطرق لتحليل البيانات ، مما يساعد في عملية صنع القرار في مختلف المشاكل التي يكون فيها عدم اليقين. يقدم هذا الموقع جميع المفاهيم النظرية التي تدعم كود البرمجة المطور ، إما بلغة R أو Python او البرماجيات الجاهزة مثل SPSS او Minitab.
المتغيرات والسكان والعينات في التحليل الإحصائي :
“المتغير” هو السمة المشتركة لجميع عناصر العينة أو المجتمع التي يمكن أن تنسب إليها رقمًا أو فئة. تختلف قيم المتغيرات من عنصر لآخر.
انواع المتغيرات Types of Variable
يمكن تصنيف المتغيرات الإحصائية على أنها متغيرات فئوية أو متغيرات رقمية. تحتوي المتغيرات الفئوية على قيم تصف “جودة” أو “خاصية” لوحدة بيانات ، مثل “أي نوع” أو “أي فئة”. تقع المتغيرات الفئوية في فئات حصرية (في فئة أو أخرى وشاملة (تشمل العديد من الخيارات الممكنة). لذلك ، المتغيرات الفئوية هي متغيرات نوعية وتميل إلى أن يتم تمثيلها بقيمة غير رقمية. وتقسم الى نوعين :
1-الاسمية: تتكون البيانات من فئات فقط. يتم قياس المتغيرات في فئات منفصلة ، وليس من الممكن إنشاء أي مؤهل أو طلب. لا يتم تعريف العمليات الحسابية القياسية (الجمع والطرح والضرب والقسمة) عند تطبيقها على هذا النوع من المتغيرات. الجنس (ذكر أو أنثى) والألوان (أزرق أو أحمر أو أخضر) مثالان على المتغيرات الاسمية.
2-. ترتيبي: تتكون البيانات من فئات يمكن ترتيبها بترتيب معين وفقًا لحجمها النسبي أو جودتها ، ولكن لا يمكن تحديدها كميًا. لا يتم تعريف العمليات الحسابية القياسية (الجمع والطرح والضرب والقسمة) عند تطبيقها على هذا النوع من المتغيرات. على سبيل المثال ، الطبقة الاجتماعية (العليا والمتوسطة والدنيا) والتعليم (الابتدائية والمتوسطة والعالية) هما مثالان على المتغيرات الترتيبية. مقاييس ليكرت (1- “لا أوافق بشدة” ، 2- “لا أوافق” ، 3- “غير متأكد” ، 4- “أوافق” ، 5- “أوافق بشدة”) هي مقاييس ترتيبية شائعة الاستخدام في العلوم الاجتماعية.
المتغيرات العددية لها قيم تصف كمية قابلة للقياس كرقم ، مثل “كم” أو “كغم”. لذلك ، فإن المتغيرات الرقمية هي متغيرات كمية. يمكن وصف المتغيرات الرقمية بمزيد من التفصيل على النحو التالي:
1-منفصلة(متقطع) : البيانات عددية. يمكن أن تأخذ المشاهدات قيمة بناءاً على عدد مجموعة من قيم الأعداد الصحيحة المميزة. لا يمكن للمتغير المنفصل أن يأخذ قيمة كسر ية من قيمة وأقرب قيمة تالية.مثل عدد السيارات المسجلة وعدد مواقع العمل وعدد الأطفال في الأسرة ، وكلها مقاسة كوحدات كاملة (أي 1 أو 2 أو 3 سيارات) هي بعض الأمثلة على المتغيرات المنفصلة.
2-مستمر: البيانات عددية. يمكن أن تأخذ المشاهدات أي قيمة بين مجموعة معينة من الأرقام الحقيقية. يمكن أن تتضمن القيمة المعطاة لمشاهدة واحدة لمتغير مستمر قيمًا دقيقة قدر الإمكان باستخدام أداة القياس. الطول والوقت مثالان على المتغيرات المستمرة.