حياة

ما هو Bootstrapping في الإحصاءات؟

ما هو Bootstrapping في الإحصاءات؟

Bootstrapping هو أسلوب إحصائي يقع تحت العنوان الأوسع لإعادة أخذ العينات. تتضمن هذه التقنية إجراءً بسيطًا نسبيًا ولكن تتكرر عدة مرات بحيث تعتمد اعتمادًا كبيرًا على حسابات الكمبيوتر. يوفر Bootstrapping طريقة غير فواصل الثقة لتقدير المعلمة السكانية. يبدو Bootstrapping كثيرًا يعمل مثل السحر. تابع القراءة لترى كيف تحصل على اسمها المثير للاهتمام.

شرح لبس الحذاء

أحد أهداف الإحصائيات الاستنتاجية هو تحديد قيمة معلمة مجتمع ما. عادة ما يكون من المكلف للغاية أو حتى من المستحيل قياس هذا مباشرة. لذلك نحن نستخدم أخذ العينات الإحصائية. نقوم باختيار عينة من السكان ، وقياس إحصائية لهذه العينة ، ثم نستخدم هذه الإحصائية لنقول شيئًا ما عن المعلمة المقابلة من السكان.

على سبيل المثال ، في مصنع الشوكولاتة ، قد نرغب في ضمان أن يكون لوز الحلوى الحلوى متوسط ​​وزن معين. ليس من الممكن أن تزن كل قطعة من الحلوى التي يتم إنتاجها ، لذلك نستخدم تقنيات أخذ العينات لاختيار 100 قطعة من الحلوى بشكل عشوائي. نقوم بحساب متوسط ​​أشرطة الحلوى 100 ونقول أن متوسط ​​السكان يقع ضمن هامش الخطأ مما يعنيه متوسط ​​العينة.

لنفترض أننا بعد بضعة أشهر نريد أن نعرف بدقة أكبر - أو أقل من هامش الخطأ - ما هو متوسط ​​وزن شريط الحلوى في اليوم الذي أخذنا فيه عينات من خط الإنتاج. لا يمكننا استخدام قضبان الحلوى اليوم ، حيث دخلت العديد من المتغيرات الصورة (مجموعات مختلفة من الحليب والسكر وفول الكاكاو ، والظروف الجوية المختلفة ، ومختلف الموظفين على الخط ، وما إلى ذلك). كل ما لدينا من اليوم الذي نشعر بالفضول هو 100 الأوزان. من دون عودة الآلة إلى ذلك اليوم ، يبدو أن هامش الخطأ الأولي هو أفضل ما يمكن أن نأمله.

لحسن الحظ ، يمكننا استخدام تقنية bootstrapping. في هذه الحالة ، نأخذ عينات عشوائية مع استبدال من الأوزان 100 المعروفة. ثم نسمي هذا نموذج bootstrap. نظرًا لأننا نسمح بالاستبدال ، فمن المحتمل ألا تكون عينة Bootstrap هذه متطابقة مع العينة الأولية. قد تتكرر بعض نقاط البيانات ، وقد يتم حذف نقاط بيانات أخرى من الـ 100 الأولى في نموذج التمهيد. بمساعدة الكمبيوتر ، يمكن إنشاء الآلاف من عينات التمهيد في وقت قصير نسبيًا.

مثال

كما ذكرنا ، لاستخدام تقنيات bootstrap فعلاً ، نحتاج إلى استخدام الكمبيوتر. سوف يساعد المثال العددي التالي في توضيح كيفية عمل العملية. إذا بدأنا بالعينة 2 و 4 و 5 و 6 و 6 ، فكل ما يلي هو عينات تمهيد ممكنة:

  • 2 ,5, 5, 6, 6
  • 4, 5, 6, 6, 6
  • 2, 2, 4, 5, 5
  • 2, 2, 2, 4, 6
  • 2, 2, 2, 2, 2
  • 4,6, 6, 6, 6

تاريخ التقنية

تعتبر تقنيات Bootstrap جديدة نسبيًا في مجال الإحصاء. تم نشر الاستخدام الأول في مقالة بقلم برادلي إيفرون عام 1979. مع زيادة قوة الحوسبة وأصبحت أقل تكلفة ، أصبحت تقنيات الحذاء أكثر انتشارًا.

لماذا اسم Bootstrapping؟

يأتي اسم "bootstrapping" من عبارة "أن يرفع نفسه من خلال bootstraps له." هذا يشير إلى شيء غير مجدي ومستحيل. حاول بأقصى ما تستطيع ، لا يمكنك رفع نفسك في الهواء عن طريق سحب قطع من الجلد على حذائك.

هناك بعض النظرية الرياضية التي تبرر تقنيات التمهيد. ومع ذلك ، فإن استخدام bootstrapping لا يبدو أنك تفعل المستحيل. على الرغم من أنه لا يبدو أنك ستكون قادراً على تحسين بناءً على تقدير إحصائية السكان من خلال إعادة استخدام نفس العينة مرارًا وتكرارًا ، إلا أن عملية إقلاع الحذاء يمكن أن تفعل ذلك في الواقع.


شاهد الفيديو: Bootstrapping and Resampling in Statistics with Example. Statistics Tutorial #12. MarinStatsLectures (يونيو 2021).