مقالات

8.1.1: مسافات العينة والاحتمالات (تمارين) - الرياضيات


القسم 8.1 مجموعة المشكلات: عينات المساحات والإمكانية

في المسائل من 1 إلى 6 ، اكتب مساحة نموذجية للتجربة المحددة.

1) يتم دحرجة قالب.

2) رمي بنس ونيكل.

3) يتم دحرجة قالب ورمي قطعة نقود.

4) رمي ثلاث عملات.

5) رمي نردان.

6) جرة تحتوي على أربع كرات مرقمة 1 ، 2 ، 3 ، 4. يتم سحب كرتين من الرخام.

في المشاكل من 7 إلى 12 ، يتم اختيار بطاقة واحدة عشوائيًا من مجموعة أوراق اللعب. أوجد الاحتمالات التالية.

7) ف (الآس)

8) ف (بطاقة حمراء)

9) ف (ناد)

10) ف (بطاقة وجه)

11) ف (جاك أو الأشياء بأسمائها الحقيقية)

12) ف (جاك وبارما)

للمسائل 13 - 16: جرة تحتوي على 6 كرات حمراء و 7 بيضاء و 7 كرات زجاجية. إذا تم اختيار كرة واحدة عشوائيًا ، فأوجد الاحتمالات التالية.

13) ف (أحمر)

14) ف (أبيض)

15) ف (أحمر أو أزرق)

16) ف (أحمر وأزرق)

بالنسبة للمشاكل 17 - 22: خذ بعين الاعتبار عائلة مكونة من ثلاثة أطفال. أوجد الاحتمالات التالية.

17) ف (ولدان وفتاة).

18) ف (ولد واحد على الأقل)

19) ف (الأبناء من كلا الجنسين).

20) ف (فتاة واحدة على الأكثر)

21) ف (الأبناء الأول والثالث ذكور)

22) ف (جميع الأطفال من نفس الجنس)

بالنسبة للمشكلات 23 - 27: يتم رمي نردتين. أوجد الاحتمالات التالية.

23) ف (مجموع النرد هو 5)

24) ف (مجموع النرد 8)

25) ف (المجموع 3 أو 6)

26) ف (المجموع أكثر من 10)

27) P (النتيجة مزدوجة) (تلميح: مزدوج يعني أن كلا النرد يظهر نفس القيمة)

بالنسبة للمشكلات 28-31: تحتوي الجرة على أربع كرات من الرخام مرقمة 1 و 2 و 3 و 4. يتم رسم كرتين عشوائيتين بدون استبدال. هذا يعني أنه بعد سحب قطعة من الرخام لا يتم استبدالها في المرطبان قبل اختيار قطعة الرخام الثانية. أوجد الاحتمالات التالية.

28) ف (مجموع الأعداد 5)

29) ف (مجموع الأرقام فردي)

30) ف (مجموع الأعداد 9)

31) ف (أحد الأرقام هو 3)

بالنسبة للمسائل 32-33: تحتوي الجرة على أربع كرات من الرخام مرقمة 1 و 2 و 3 و 4. يتم رسم كرتين عشوائيتين باستخدام الاستبدال. هذا يعني أنه بعد سحب قطعة من الرخام ، يتم استبدالها في الجرة قبل اختيار قطعة الرخام الثانية. أوجد الاحتمالات التالية.

32) ف (مجموع الأعداد 5)

33) ف (مجموع الأعداد 2)


8.1.1: مسافات العينة والاحتمالات (تمارين) - الرياضيات

دحرجة قالب عادي من ستة جوانب هو مثال مألوف على تجربة عشوائية، إجراء يمكن من أجله سرد جميع النتائج المحتملة ، ولكن لا يمكن التنبؤ بالنتيجة الفعلية لأي تجربة معينة على وجه اليقين. في مثل هذه الحالة ، نرغب في تخصيص كل نتيجة ، مثل طرح رقمين ، يسمى احتمالا من النتيجة ، يشير ذلك إلى مدى احتمالية حدوث النتيجة. وبالمثل ، نود تعيين احتمال لأي احتمال حدث، أو مجموعة من النتائج ، مثل عرض رقم زوجي ، مما يشير إلى مدى احتمالية وقوع الحدث إذا تم تنفيذ التجربة. يوفر هذا القسم إطارًا لمناقشة مشكلات الاحتمالات باستخدام المصطلحات المذكورة للتو.

تعريف

أ تجربة عشوائية هي آلية تنتج نتيجة محددة لا يمكن التنبؤ بها على وجه اليقين. ال عينة الفضاء مجموعة جميع النتائج المحتملة لتجربة عشوائية. المرتبطة بتجربة عشوائية هي مجموعة جميع النتائج الممكنة. ان الحدث أي مجموعة من النتائج. هي مجموعة فرعية من مساحة العينة.

تعريف

حدث ه يقال ل تحدث في تجربة معينة للتجربة إذا كانت النتيجة الملاحظة عنصرًا من المجموعة ه.

مثال 1

أنشئ مساحة نموذجية للتجربة تتكون من رمي قطعة نقود واحدة.

يمكن تسمية النتائج ح للرؤوس و ر لذيول. ثم تكون مساحة العينة هي المجموعة S = .

مثال 2

قم ببناء مساحة عينة للتجربة تتكون من دحرجة قالب واحد. ابحث عن الأحداث التي تتوافق مع العبارات "تم تدحرج رقم زوجي" و "تم تدحرج رقم أكبر من اثنين".

يمكن تصنيف النتائج وفقًا لعدد النقاط على الوجه العلوي للنرد. ثم مساحة العينة هي المجموعة S = <1،2،3،4،5،6>.

النتائج الزوجية هي 2 و 4 و 6 ، لذا فإن الحدث الذي يتوافق مع عبارة "تم تدحرج رقم زوجي" هو المجموعة <2،4،6> ، والتي من الطبيعي الإشارة إليها بالحرف ه. نكتب E = <2،4،6>.

وبالمثل ، فإن الحدث الذي يتوافق مع عبارة "يتم تدحرج رقم أكبر من اثنين" هو المجموعة T = <3،4،5،6> ، والتي أشرنا إليها تي.

التمثيل الرسومي لعينة الفضاء والأحداث هو أ مخطط فين، كما هو موضح في الشكل 3.1 "مخططات Venn لمساحتين من العينات" للملاحظة 3.6 "المثال 1" والملاحظة 3.7 "المثال 2". بشكل عام مساحة العينة س يمثلها مستطيل ، والنتائج بنقاط داخل المستطيل ، والأحداث بواسطة أشكال بيضاوية تحيط بالنتائج التي تتكون منها.

الشكل 3.1 مخططات فين لاثنين من عينات المساحات

مثال 3

تتكون التجربة العشوائية من رمي عملتين.

  1. أنشئ مساحة نموذجية للموقف الذي لا يمكن فيه تمييز العملات المعدنية ، مثل بنسين جديدين تمامًا.
  2. أنشئ مساحة نموذجية للموقف الذي يمكن فيه تمييز العملات المعدنية ، مثل أحدهما بنس واحد والآخر نيكل.
  1. بعد رمي العملات ، يرى المرء إما رأسين ، يمكن تسميتهما بساعتين ، أو ذيلان ، يمكن تسمية 2 طن ، أو عملات معدنية مختلفة ، والتي يمكن تسميتها د. وبالتالي فإن مساحة العينة هي S = <2 h ، 2 t ، d>.
  2. نظرًا لأنه يمكننا التمييز بين العملات المعدنية ، فهناك الآن طريقتان للاختلاف بين العملات المعدنية: رؤوس العملات المعدنية وذيول النيكل ، أو ذيول العملات المعدنية ورؤوس النيكل. يمكننا تصنيف كل نتيجة على أنها زوج من الأحرف ، يشير أولهما إلى كيفية هبوط العملة ، ويشير الثاني إلى كيفية هبوط النيكل. ثم تكون مساحة العينة S ′ = .

الجهاز الذي يمكن أن يكون مفيدًا في تحديد جميع النتائج المحتملة لتجربة عشوائية ، لا سيما تلك التي يمكن اعتبارها تجري على مراحل ، هو ما يسمى مخطط الشجرة. تم وصفه في المثال التالي.

مثال 4

قم ببناء مساحة عينة تصف جميع العائلات المكونة من ثلاثة أطفال وفقًا لجنس الأطفال فيما يتعلق بترتيب الميلاد.

اثنتان من النتيجتين هما "ولدان ثم بنت" ، وهو ما قد نشير إليه ب ب ب ج ، و "فتاة ثم صبيان" ، وهو ما نشير إليه ب ج ب. من الواضح أن هناك العديد من النتائج ، وعندما نحاول سردها جميعًا ، قد يكون من الصعب التأكد من أننا وجدناها جميعًا ما لم نواصل العمل بشكل منهجي. مخطط الشجرة الموضح في الشكل 3.2 "مخطط الشجرة للأسر المكونة من ثلاثة أطفال" ، يعطي نهجًا منهجيًا.

الشكل 3.2 مخطط شجرة لعائلات ثلاثة أطفال

تم إنشاء المخطط على النحو التالي. هناك احتمالان للطفل الأول ، صبي أو بنت ، لذلك نرسم جزأين من الخطوط يخرجان من نقطة البداية ، أحدهما ينتهي بـ ب لـ "الصبي" والآخر ينتهي بـ ز لفتاة." لكل من هذين الاحتمالين للطفل الأول هناك احتمالان للطفل الثاني ، "صبي" أو "فتاة" ، لذلك من كل من ب و ز نرسم جزأين من الخط ، جزء واحد ينتهي ب ب وواحد في ز. لكل نقطة من نقاط النهاية الأربع في الرسم التخطيطي الآن احتمالان للطفل الثالث ، لذلك نكرر العملية مرة أخرى.

يتم استدعاء مقاطع الخط الفروع من الشجرة. تسمى نقطة النهاية اليمنى لكل فرع أ العقدة. العقد الموجودة في أقصى اليمين هي العقد النهائية لكل منها هناك نتيجة ، كما هو موضح في الشكل.

من السهل قراءة النتائج الثمانية للتجربة من الشجرة ، وبالتالي فإن مساحة العينة هي القراءة من أعلى إلى أسفل العقد النهائية في الشجرة ،


8.1.1: مسافات العينة والاحتمالات (تمارين) - الرياضيات

ستقدم الدورة المفهوم الأساسي لنظرية الاحتمالات وتطبيقها على الإحصاء. سيكون التركيز على مناقشة الطلبات.

النص الذي سيتم استخدامه هو:

جاي إل ديفور ، الاحتمال والاحصاء، الطبعة الثامنة أو التاسعة ، طومسون

يمكن العثور على المنهج هنا.

سيكون هناك اثنان في منتصف المدة.

التمرين المدرج مخصص لجمع المخلفات الخطرة. سأجمعها كل أسبوعين وتمارين الصف الثاني أو الثالث من بين التمارين المخصصة. في حالة وجود اختلافات بين الإصدارين التاسع والثامن من الكتاب ، سأشير بين قوسين مربعين إلى الرقم المتعلق بالطبعة الثامنة.

تعتمد الدرجة النهائية على القواعد التالية: 45٪ نهائي ، 40٪ نصف فصل دراسي ، 15٪ HW. سيتم التقويس على النتيجة النهائية.

سيبدأ منتصف الفصل الدراسي الأول الأربعاء 17 فبراير والثاني يوم الأربعاء 30 مارس.

الحجج المغطاة.

  • البديهيات والتفسيرات وخصائص الاحتمالات
  • التوزيعات الاحتمالية للمتغيرات العشوائية المنفصلة
  • مثال على المتغيرات العشوائية المنفصلة
  • المتغيرات العشوائية المستمرة ووظائف كثافة الاحتمال
  • مثال على المتغيرات العشوائية المستمرة
  • نظرية الحد المركزي
  • المتغيرات العشوائية الموزعة بشكل مشترك
  • السكان والعينة والعمليات
  • تقدير النقطة
  • الفترات الإحصائية
  • اختبار الفرضيات
  • الانحدار الخطي البسيط (إذا سمح الوقت)
  • 1.1 (السكان والعينة والعمليات)
  • 1.2 (الطرق التصويرية والجداولية في الإحصاء الوصفي)
  • 1.3 (قياس الموقع)
  • 1.4 (قياس التباين)

أول HW بسبب 25 يناير.

  • 2.1 (نماذج من المساحات والأحداث)
  • 2.2 (البديهيات والتفسيرات وخصائص الاحتمالات)
  • 3.1 (المتغيرات العشوائية)
  • 3.2 (التوزيعات الاحتمالية للمتغيرات العشوائية المنفصلة)
  • 3.3 (القيم المتوقعة للمتغير العشوائي المنفصل)
  • (3.1) 6, 8, 10
  • (3.2) 16, 23, 27
  • (3.3) 29, 35 39, 42
  • 3.4 (التوزيع الاحتمالي ذي الحدين)
  • 3.5 (التوزيع الهندسي المفرط)
  • 3.6 (توزيع احتمالية بواسون)

وستكون منتصف المدة الأولى في 17 فبراير. وسيغطي منتصف المدة المواد حتى القسم 3.6.

مواد التحضير للنصف الأول من الفصل الدراسي:

الأسبوعان السادس والسابع

  • 4.1 (المتغيرات العشوائية المستمرة ووظائف كثافة الاحتمال)
  • 4.2 (وظائف التوزيع التراكمي والقيم المتوقعة)
  • 4.3 (التوزيع الطبيعي)
  • 4.4 (التوزيع الأسي)
  • 5.1 (المتغيرات العشوائية الموزعة بشكل مشترك)
  • 5.2 (القيم المتوقعة والتغاير والارتباط)
  • 5.5 (توزيع مجموعة خطية)
  • 5.3 (الإحصائيات وتوزيعها)
  • 5.4 (متوسط ​​توزيع العينة)
  • (5.3) 37, 41, 42
  • (5.4) 48, 49, 53, 56

مواد التحضير لمنتصف الفصل الثاني:

خامس واجب واجب بتاريخ 4 أبريل. التدريبات هي تلك المذكورة أعلاه للفصل الخامس.

هنا نص ماكياج Otional النصف الثاني من المدة. تحقق من ذلك واسمحوا لي أن أعرف إذا كان لديك سؤال. انها مستحقة الاثنين 11 مساءا. يمكنك إرسالها في الفصل أو عبر البريد الإلكتروني أو عن طريق تحريكها أسفل باب مكتبي. يجب أن يحتوي إرسالك على ملف أول صفحة موقعة


3.3: الاحتمالية المشروطة والأحداث المستقلة

أساسي

  1. Q3.3.1 لحدثين (A ) و (B ) ، (P (A) = 0.73 ، P (B) = 0.48 نص P (A cap B) = 0.29 ).
    1. ابحث عن (P (A mid B) ).
    2. ابحث عن (P (B mid A) ).
    3. حدد ما إذا كان (A ) و (B ) مستقلين أم لا.
    1. ابحث عن (P (A mid B) ).
    2. ابحث عن (P (B mid A) ).
    3. حدد ما إذا كان (A ) و (B ) مستقلين أم لا.
    1. (ف (أ غطاء ب) ).
    2. ابحث عن (P (A mid B) ).
    3. ابحث عن (P (B mid A) ).
    1. (ف (أ غطاء ب) ).
    2. ابحث عن (P (A mid B) ).
    3. ابحث عن (P (B mid A) ).
    1. ابحث عن (P (A mid B) ).
    2. ابحث عن (P (B mid A) ).
    1. ابحث عن (P (A mid B) ).
    2. ابحث عن (P (B mid A) ).
    1. احتمالية أن تكون اللفة متساوية.
    2. احتمالية أن تكون اللفة متساوية ، لأنها ليست اثنين.
    3. احتمالية أن تكون اللفة متساوية ، لأنها ليست واحدة.
    1. احتمالية أن تكون القرعة الثانية هي الرؤوس.
    2. احتمالية أن تكون القرعة الثانية هي الرأس ، بالنظر إلى أن القرعة الأولى هي الرأس.
    3. احتمالية أن تكون القرعة الثانية وجهًا لوجه ، بالنظر إلى أن واحدة على الأقل من الرميتين تكون رأسية.
    1. احتمالية أن تكون البطاقة المسحوبة حمراء.
    2. احتمالية أن تكون البطاقة حمراء لأنها ليست خضراء.
    3. احتمالية أن تكون البطاقة حمراء ، لأنها ليست حمراء ولا صفراء.
    4. احتمالية أن تكون البطاقة حمراء ، لأنها ليست أربعة.
    1. احتمالية أن تكون البطاقة المسحوبة هي اثنين أو أربعة.
    2. احتمالية أن تكون البطاقة من اثنين أو أربعة ، على ألا تكون واحدة.
    3. احتمالية أن تكون البطاقة هي اثنين أو أربعة ، على اعتبار أنها إما اثنين أو ثلاثة.
    4. احتمالية أن تكون البطاقة من اثنين أو أربعة ، إذا كانت حمراء أو خضراء.
    1. (P (A) ، P (R) ، P (A cap B) ).
    2. بناءً على الإجابة على (أ) ، حدد ما إذا كانت الأحداث (أ ) و (ص ) مستقلة أم لا.
    3. بناءً على الإجابة على (ب) ، حدد ما إذا كان يمكن توقع (P (A mid R) ) أم لا دون أي حساب. إذا كان الأمر كذلك ، فقم بالتنبؤ. في أي حال ، احسب (P (A mid R) ) باستخدام قاعدة الاحتمال الشرطي.
    1. (P (A) ، P (R) ، P (A cap B) ).
    2. بناءً على الإجابة على (أ) ، حدد ما إذا كانت الأحداث (أ ) و (ص ) مستقلة أم لا.
    3. بناءً على الإجابة على (ب) ، حدد ما إذا كان يمكن توقع (P (A mid R) ) أم لا دون أي حساب. إذا كان الأمر كذلك ، فقم بالتنبؤ. في أي حال ، احسب (P (A mid R) ) باستخدام قاعدة الاحتمال الشرطي.
    1. (ف (أ غطاء ب) ).
    2. (P (A cap B) ) ، مع المعلومات الإضافية التي (A ) و (B ) مستقلتان.
    3. (P (A cap B) ) ، مع المعلومات الإضافية التي (A ) و (B ) متنافيتان.
    1. (ف (أ غطاء ب) ).
    2. (P (A cap B) ) ، مع المعلومات الإضافية التي (A ) و (B ) مستقلتان.
    3. (P (A cap B) ) ، مع المعلومات الإضافية التي (A ) و (B ) متنافيتان.
    1. (ف (أ غطاء ب غطاء ج) ).
    2. (P (A ^ c cap B ^ c cap C ^ c) ).
    1. (ف (أ غطاء ب غطاء ج) ).
    2. (P (A ^ c cap B ^ c cap C ^ c) ).

    التطبيقات

    Q3.3.17

    مساحة العينة التي تصف جميع العائلات المكونة من ثلاثة أطفال وفقًا لجنس الأطفال فيما يتعلق بترتيب الميلاد هي [S = ] في تجربة اختيار عائلة مكونة من ثلاثة أطفال بشكل عشوائي ، احسب كل من الاحتمالات التالية ، بافتراض أن جميع النتائج متساوية في الاحتمال.

    1. احتمال أن يكون للعائلة ولدان على الأقل.
    2. احتمال أن يكون للعائلة ولدان على الأقل ، بالنظر إلى أن الأطفال ليسوا جميعهم من الفتيات.
    3. احتمالية أن يكون طفل واحد على الأقل ولدًا.
    4. احتمالية أن يكون طفل واحد على الأقل ولدًا ، إذا كان المولود الأول أنثى.

    Q3.3.18

    يعطي جدول الطوارئ ثنائي الاتجاه التالي توزيعًا للسكان في منطقة محلية معينة وفقًا للعمر وعدد انتهاكات حركة المركبات في السنوات الثلاث الماضية:

    سن الانتهاكات
    (0) (1) (2+)
    تحت سن 21) (0.04) (0.06) (0.02)
    (21-40) (0.25) (0.16) (0.01)
    (41-60) (0.23) (0.10) (0.02)
    (60+) (0.08) (0.03) (0.00)

    يتم اختيار الشخص بشكل عشوائي. أوجد الاحتمالات التالية.

    1. الشخص أقل من (21 ).
    2. تعرض الشخص لانتهاكين على الأقل في السنوات الثلاث الماضية.
    3. - أن يكون لدى الشخص مخالفتان على الأقل في السنوات الثلاث الماضية ، على اعتبار أنه دون (21 ).
    4. أن يكون الشخص تحت (21 ) حيث أنه قد تعرض لمخالفتين على الأقل خلال السنوات الثلاث الماضية.
    5. تحديد ما إذا كانت الأحداث & ldquo ؛ & ldquo ؛ & ردقوو) & ldquo و & ldquo و ldquothe الشخص قد ارتكبت على الأقل اثنين من الانتهاكات في السنوات الثلاث الماضية rdquo مستقلة أم لا.

    Q3.3.19

    يعطي جدول الطوارئ ثنائي الاتجاه التالي تفصيل السكان في منطقة محلية معينة وفقًا للانتماء الحزبي ( (أ ، ب ، ج ، نص)) والرأي في إصدار السندات:

    انتساب رأي
    حسنات يعارض غير محدد
    (أ) (0.12) (0.09) (0.07)
    (ب) (0.16) (0.12) (0.14)
    (ج ) (0.04) (0.03) (0.06)
    لا أحد (0.08) (0.06) (0.03)

    يتم اختيار الشخص بشكل عشوائي. أوجد كل الاحتمالات التالية.

    1. الشخص مؤيد لإصدار السندات.
    2. يؤيد الشخص اصدار السند كونه منتميا لحزب (أ ).
    3. أن يكون الشخص مؤيداً لإصدار السند كونه منتمياً إلى الحزب (ب ).

    Q3.3.20

    يعطي جدول الطوارئ ثنائي الاتجاه التالي توزيعًا لعدد المستفيدين في متجر بقالة وفقًا لعدد العناصر المشتراة وما إذا كان المستفيد قد أجرى عملية شراء اندفاعية أم لا في عداد الخروج:

    عدد العناصر شراء الدافع
    صنع لم يصدر
    عدد قليل (0.01) (0.19)
    عديدة (0.04) (0.76)

    يتم اختيار المستفيد بشكل عشوائي. أوجد كل الاحتمالات التالية.

    1. قام المستفيد بعملية شراء اندفاعية.
    2. قام المستفيد بعملية شراء اندفاعية ، نظرًا لأن العدد الإجمالي للعناصر المشتراة كان كثيرًا.
    3. تحديد ما إذا كانت الأحداث والمشتريات ldquofew rdquo و & ldquomade شراء دافع في عداد الخروج & rdquo مستقلة أم لا.

    Q3.3.21

    يعطي جدول الطوارئ ثنائي الاتجاه التالي تفاصيل السكان البالغين في منطقة معينة وفقًا لنوع العمل ومستوى التأمين على الحياة:

    نوع الوظيفة مستوى التأمين
    قليل متوسط عالي
    غير ماهر (0.07) (0.19) (0.00)
    شبه المهرة (0.04) (0.28) (0.08)
    ماهر (0.03) (0.18) (0.05)
    احترافي (0.01) (0.05) (0.02)

    يتم اختيار شخص بالغ عشوائيًا. أوجد كل الاحتمالات التالية.

    1. يتمتع الشخص بمستوى عالٍ من التأمين على الحياة.
    2. يتمتع الشخص بمستوى عالٍ من التأمين على الحياة ، حيث لا يشغل منصبًا مهنيًا.
    3. يتمتع الشخص بمستوى عالٍ من التأمين على الحياة ، بالنظر إلى أنه يشغل منصبًا احترافيًا.
    4. تحديد ما إذا كانت الأحداث و ldquo لديها مستوى عال من التأمين على الحياة و rdquo و ldquo لها منصب مهني و rdquo مستقلة.

    Q3.3.22

    مساحة العينة للنتائج المحتملة المتساوية لتجربة رمي نردتين عادلتين هي [ start 11 & amp 12 & amp 13 & amp 14 & amp 15 & amp 16 21 & amp 22 & amp 23 & amp 24 & amp 25 & amp 26 31 & amp 32 & amp 33 & amp 34 & amp 35 & amp 36 41 & amp 42 & amp 43 & amp 44 & amp 45 & amp 46 51 & amp 52 & amp 53 & amp 54 & amp 55 & amp 56 61 & amp 62 & amp 63 & amp 64 & amp 65 & amp 66 end] تحديد الأحداث ( text).

    1. ابحث عن (P (N) ).
    2. ابحث عن (P (N mid F) ).
    3. ابحث عن (P (N mid T) ).
    4. حدد من الإجابات السابقة ما إذا كانت الأحداث (N ) و (F ) مستقلة أم لا سواء (N ) و (T ) أم لا.

    Q3.3.23

    ال حساسية اختبار المخدرات هو احتمال أن يكون الاختبار إيجابيًا عند إعطائه لشخص تناول العقار بالفعل. افترض أن هناك اختبارين مستقلين للكشف عن وجود نوع معين من الأدوية المحظورة لدى الرياضيين. أحدهما لديه حساسية (0.75 ) والآخر لديه حساسية (0.85 ). إذا تم تطبيق كلاهما على رياضي تناول هذا النوع من المخدرات ، فما هي احتمالية عدم اكتشاف استخدامه؟

    Q3.3.24

    رجل لديه مصباحان في منزل البئر الخاص به لمنع الأنابيب من التجمد في الشتاء. يتفقد الأضواء يوميا. لكل ضوء احتمال (0.002 ) أن يحترق قبل أن يتم فحصه في اليوم التالي (بغض النظر عن الضوء الآخر).

    1. إذا تم توصيل الأضواء بالتوازي ، فسيستمر أحدها في التألق حتى إذا احترق الآخر. في هذه الحالة ، احسب احتمال استمرار سطوع ضوء واحد على الأقل لمدة (24 ) ساعة كاملة. لاحظ الموثوقية المتزايدة بشكل كبير لنظام المصباحين مقارنة بالمصباح الواحد.
    2. إذا تم توصيل الأضواء في سلسلة ، فلن يستمر أحد في التألق حتى لو احترق أحدها فقط. في هذه الحالة ، احسب احتمال استمرار سطوع ضوء واحد على الأقل طوال (24 ) ساعة. لاحظ انخفاض موثوقية نظام المصباحين بشكل طفيف مقارنة بالمصباح الواحد.

    Q3.3.25

    لاحظ أحد المحاسبين أن (5 ٪ ) من جميع نسخ نموذج من جزأين معين بها خطأ في الجزء الأول ، و (2 ٪ ) بها خطأ في الجزء الثاني. إذا حدثت الأخطاء بشكل مستقل ، فابحث عن احتمال أن النموذج المختار عشوائيًا سيكون خاليًا من الأخطاء.

    Q3.3.26

    صندوق يحتوي على (20 ) براغي متطابقة في الحجم ولكن (12 ) منها مطلية بالزنك و (8 ) ليست كذلك. يتم اختيار اثنين من البراغي بشكل عشوائي ، دون استبدال.

    1. أوجد احتمال أن كلاهما مطلي بالزنك.
    2. أوجد احتمال أن يكون أحدها على الأقل مغطى بالزنك.

    تمارين إضافية

    Q3.3.27

    الأحداث (أ ) و (ب ) متنافيتان. ابحث عن (P (A mid B) ).

    Q3.3.28

    يتألف مجلس مدينة مدينة معينة من خمسة أعضاء من الحزب (أ ) وأربعة أعضاء في الحزب (ب ) وثلاثة مستقلين. يتم اختيار عضوين من أعضاء المجلس بشكل عشوائي لتشكيل لجنة تحقيق.

    1. أوجد احتمال أن كلاهما من الطرف (أ ).
    2. أوجد احتمال أن يكون أحدهما على الأقل مستقلًا.
    3. أوجد احتمال أن يكون لهما انتماءات حزبية مختلفة (أي ، ليس كلاهما (أ ) ، وليس كلاهما (ب ) ، وليس كلاهما مستقلين).

    Q3.3.29

    يقوم لاعب كرة السلة بتنفيذ (60 ٪ ) من الرميات الحرة التي يحاولها ، باستثناء أنه إذا حاول للتو وفاتت رمية حرة ، فإن فرصه في تحقيق رمية ثانية تنخفض إلى (30 ٪ ) فقط. . افترض أنه حصل للتو على رميتين حرتين.

    1. أوجد احتمال أن يصنع كليهما.
    2. أوجد احتمال أن يكون هو واحد على الأقل. (يمكن أن يساعد مخطط الشجرة.)

    Q3.3.30

    يرغب أحد الاقتصاديين في التأكد من نسبة (ع ) سكان دافعي الضرائب الأفراد الذين قدموا عمدًا معلومات احتيالية بشأن إقرار ضريبة الدخل. لضمان عدم الكشف عن هويات دافعي الضرائب حقًا في مسح عشوائي ، يتم إعطاء دافعي الضرائب المستجوبين التعليمات التالية.

    1. اقلب عملة.
    2. إذا هبطت العملة ، أجب "نعم و rdquo على السؤال" هل سبق لك أن قدمت معلومات احتيالية بشأن الإقرار الضريبي؟ & rdquo حتى لو لم تقم بذلك.
    3. إذا هبطت العملة ، فقم بإعطاء صدق & ldquo نعم & rdquo أو & ldquo لا & rdquo الإجابة على السؤال & ldquo هل سبق لك أن قدمت معلومات احتيالية بشأن الإقرار الضريبي؟ & rdquo

    لم يتم إخبار السائل بكيفية هبوط العملة ، لذلك فهو لا يعرف ما إذا كانت الإجابة "نعم" هي الحقيقة أم أنها أعطيت فقط بسبب إلقاء العملة.


    إحصائيات متعددة المتغيرات

    من الطرق الشائعة لتطوير قاعدة تمييزية البدء بافتراض (أو تقدير) توزيع مختلف لـ ( mathbf x in mathbb R ^ p ) لكل مجموعة سكانية. على سبيل المثال ، افترض أن الملاحظات في المجتمع (j ) لها توزيع مع pdf (f_j ( mathbf x) ) ، لـ (j = 1 ، ldots ، g ).

    سنبدأ بافتراض التوزيعات السكانية المختلفة (f_1 ( mathbf x) ، ldots ، f_g ( mathbf x) ) هي معروف، وعلى وجه الخصوص ، أنها توزيعات عادية متعددة المتغيرات.

    مثال 8.2 ضع في اعتبارك الحالة أحادية المتغير مع (g = 2 ) حيث ( Pi_1 ) هو التوزيع (N ( mu_1، sigma_1 ^ 2) ) و ( Pi_2 ) هو (N ( mu_2، sigma_2 ^ 2) ) التوزيع. تخصص قاعدة تمييز ML (x ) إلى ( Pi_1 ) إذا وفقط إذا كان [f_1 (x) & gt f_2 (x) ، ] يعادل [ frac <1> <(2 ) بي sigma_1 ^ 2) ^ <1/2 >> exp left (- frac <1> <2 sigma_1 ^ 2> (x- mu_1) ^ 2 right) & gt frac <1> <( 2 pi sigma_2 ^ 2) ^ <1/2 >> exp left (- frac <1> <2 sigma_2 ^ 2> (x- mu_2) ^ 2 right). ] جمع المصطلحات معًا على الجانب الأيسر (LHS) يعطي [ start & amp & amp qquad frac < sigma_2> < sigma_1> exp left (- frac <1> <2 sigma_1 ^ 2> (x - mu_1) ^ 2 + frac <1> <2 sigma_2 ^ 2> (x - mu_2) ^ 2 right) & gt 1 & amp iff & amp qquad log left ( frac < sigma_2> < sigma_1> right) - frac <1> <2 sigma_1 ^ 2> (x - mu_1) ^ 2 + frac <1> <2 sigma_2 ^ 2> (x - mu_2) ^ 2 & gt 0 & amp iff & amp qquad x ^ 2 left ( frac <1> < sigma_2 ^ 2> - frac <1> < sigma_1 ^ 2> right) + x left ( frac <2 mu_1> < sigma_1 ^ 2> - frac <2 mu_2> < sigma_2 ^ 2> right) + frac < mu_2 ^ 2> < sigma_2 ^ 2> - frac < mu_1 ^ 2> < sigma_1 ^ 2> + 2 log frac < sigma_2> < sigma_1> & gt 0. tag <8.2> end] افترض ، على سبيل المثال ، أن ( mu_1 = sigma_1 = 1 ) و ( mu_2 = sigma_2 = 2 ) ، فإن هذا يقلل إلى التعبير التربيعي [- frac <3> <4> x ^ 2 + x + 2 log 2 & gt 0. ] افترض أن ملاحظتنا الجديدة هي (x = 0 ) ، على سبيل المثال. ثم يكون LHS هو (2 log 2 ) وهو أكبر من الصفر ولذا فإننا نخصص (x ) للسكان 1.

    باستخدام صيغة المعادلة التربيعية نجد أن (f_1 (x) = f_2 (x) ) عندما [x = frac <-1 pm sqrt <1 + 6 log 2 >> <-3/2> = frac <2> <3> pm frac <2> <3> sqrt <1 + 6 log 2>، ] ie at (x = -0.85 ) and (x = 2.18 ) . وبالتالي ، فإن قاعدة التمييز الخاصة بنا هي تخصيص (x ) إلى ( Pi_1 ) إذا (- 0.85 & lt x & lt 2.18 ) وتخصيصها لـ ( Pi_2 ) بخلاف ذلك. هذا موضح في الشكل 8.2.

    الشكل 8.2: القاعدة التمييزية لمثال غاوسين.

    لاحظ أن هذا لم ينتج عنه مناطق تمييز محدبة متصلة ( mathcal_أنا) . هذا لأن دوالنا المميزة لم تكن وظائف خطية لـ ( mathbf x ) - وبالتالي لم نجد قاعدة تمييز خطية.

    لاحظ أيضًا أنه إذا ( sigma_1 = sigma_2 ) ، فإن المصطلح (x ^ 2 ) في المعادلة (8.2) يُلغى ، ويتبقى لنا قاعدة تمييز خطية. على سبيل المثال ، إذا كان ( sigma_2 = 1 ) مع المعلمات الأخرى كما في السابق ، فإننا نصنف (x ) إلى السكان 1 إذا

    [2x left ( mu_1 - mu_2 right) + mu_2 ^ 2 - mu_1 ^ 2 = -2x + 3 & gt 0. ] أي ، إذا (x & lt frac <3> <2> ) . في هذه الحالة ، نحصل على مناطق مميزة ( mathcal_j ) المتصلة والمحدبة.

    الشكل 8.3: القاعدة التمييزية لمثال غاوسين عندما sigma_2 = 1

    8.1.1 السكان العاديون متعدد المتغيرات

    الآن نحن نعتبر حالة (g ) السكان العاديين متعدد المتغيرات. سنفترض أنه بالنسبة للسكان (k ) [ mathbf x sim N_p (< boldsymbol < mu >> _ k، boldsymbol < Sigma>) ] أي أننا نسمح لمتوسط ​​كل مجموعة بالتنوع ، لكنهم افترضوا مصفوفة تغاير مشتركة بين المجموعات. نسمي (< boldsymbol < mu >> _ k ) ال يعني السكان أو النقطه الوسطى.

    الاقتراح 8.2 إذا كانت الحالات في السكان ( Pi_k ) لها توزيع (N_p (< boldsymbol < mu >> _ k، boldsymbol < Sigma>) ) ، فإن قاعدة تمييز ML هي [d ( mathbf x ) = arg min_( mathbf x - < boldsymbol < mu >> _ k) ^ top boldsymbol < Sigma> ^ <-1> ( mathbf x - < boldsymbol < mu >> _ k). ]

    بالتساوي ، إذا ( delta_k ( mathbf x) = 2 < boldsymbol < mu >> _ k ^ top boldsymbol < Sigma> ^ <-1> mathbf x- < boldsymbol < mu >> _ k ^ top Sigma ^ <-1> < boldsymbol < mu >> _ k ). ثم [d ( mathbf x) = arg max delta_k ( mathbf x). ] أي. هذه قاعدة مميزة خطية.

    دليل. الاحتمال (ك ) هو [ البدء f_k ( mathbf x) = | 2 pi boldsymbol < Sigma> | ^ <-1/2> exp left (- frac <1> <2> ( mathbf x- < boldsymbol < mu >> _ k) ^ top boldsymbol < Sigma> ^ <-1> ( mathbf x- < boldsymbol < mu >> _ k) right). tag <8.3> end] يتم تكبير هذا عندما يتم تصغير الأس ، بسبب علامة الطرح في الأس ولأن ( boldsymbol < Sigma> ) موجب محدد.

    [يبدأ ( mathbf x - < boldsymbol < mu >> _ k) ^ top boldsymbol < Sigma> ^ <-1> ( mathbf x - < boldsymbol < mu >> _ k) & amp = mathbf x ^ top boldsymbol < Sigma> ^ <-1> mathbf x -2 < boldsymbol < mu >> _ k ^ top boldsymbol < Sigma> ^ <-1> mathbf x + < boldsymbol < mu >> _ k ^ top boldsymbol < Sigma> ^ <-1> < boldsymbol < mu >> _ k & amp = mathbf x ^ top boldsymbol < Sigma> ^ <-1> mathbf x - delta_k ( mathbf x) النهاية] وهكذا ، [ arg min_k ( mathbf x - < boldsymbol < mu >> _ k) ^ top boldsymbol < Sigma> ^ <-1> ( mathbf x - < boldsymbol < mu >> _ k) = arg max_k delta_k ( mathbf x) ] حيث لا يعتمد ( mathbf x ^ top boldsymbol < Sigma> mathbf x ) على (k ).

    8.1.2 قاعدة تمييز العينة ML

    لاستخدام قاعدة تمييز ML ، نحتاج إلى معرفة معلمات النموذج لكل مجموعة ، (< boldsymbol < mu >> _ k ) ، بالإضافة إلى مصفوفة التغاير المشتركة ( boldsymbol < Sigma> ). لن نعرف عادةً هذه المعلمات ، وبدلاً من ذلك يجب تقديرها من تمرين البيانات. ثم نعوض بهذه التقديرات في قاعدة التمييز. تتكون بيانات التدريب عادةً من عينات ( mathbf x_ <1، k>، ldots، mathbf x_) معروف أنه من السكان ( Pi_k ) ، حيث (n_k ) هو عدد الملاحظات من السكان ( Pi_k ).

    نحن نقدر السكان غير المعروفين من خلال متوسط ​​العينة لكل مجموعة [ hat << boldsymbol < mu >>> _ k = frac <1> مجموع_^ mathbf x_.]

    لتقدير مصفوفة التغاير المشتركة ، ( boldsymbol < Sigma> ) ، احسب أولاً نموذج مصفوفة التغاير للمجموعة (k ) th: [ mathbf S_j = frac <1>مجموع_^ ( mathbf x_- قبعة << boldsymbol < mu >>> _ j) ( mathbf x_- قبعة << boldsymbol < mu >>> _ j) ^ top ]

    ثم [ ابدأ واسعهات < boldsymbol < سيجما >> = فارك <1> مجموع_^ g n_k mathbf S_k tag <8.4> end] تقدير غير متحيز لـ ( boldsymbol < Sigma> ) حيث (n = n_1 + n_2 + ldots + n_g ). لاحظ أن هذا ليس هو نفسه مصفوفة التغاير الكلي (أي تجاهل تسميات الفئة).

    يتم بعد ذلك تحديد قاعدة تمييز ML في العينة عن طريق استبدال هذه التقديرات في 8.2.

    0 $ حيث $ hat < ba> = widehat < bSigma> ^ <-1> ( bar < bmu> _1 - bar < bmu> _2) $، $ hat < bh> = frac <1> <2> ( bar < bmu> _1 + bar < bmu> _2) $ و $ widehat < bSigma> $ ، التقدير المجمع لـ $ bSigma $ ، يُعطى بواسطة $ widehat < bSigma> = frac <1> (n_1 bS_1 + n_2 bS_2). $ ->

    8.1.3 مجموعتان

    إذا فكرنا في الموقف حيث ( boldsymbol < Sigma> = mathbf I ) ، فيمكننا فهم هذه القاعدة هندسيًا. إذا كان التباين بين المجموعتين هو مصفوفة الهوية ، فيمكننا ببساطة التصنيف إلى أقرب وسط / وسط سكاني ، وبالتالي فإن حدود القرار هي المنصف العمودي للقطتين النقطتين الوسطى. وعلاوة على ذلك،

    ( mathbf a = < boldsymbol < mu >> _ 1 - < boldsymbol < mu >> _ 2 ) هو المتجه بين النقطتين النقطتين للسكان ، وبالتالي سيكون عموديًا على حدود القرار.

    معادلة حدود القرار هي ( mathbf a ^ top ( mathbf x- mathbf h) = 0 ).

    بالتفكير في المنتج العددي ، يمكننا أن نرى أن ( mathbf a ^ top ( mathbf x- mathbf h) ) يتناسب مع جيب تمام الزاوية بين ( mathbf a ) و ( mathbf س- mathbf ح ). ستكون النقطة ( mathbf x ) أقرب إلى (< boldsymbol < mu >> _ 1 ) من (> _ 2 ) إذا كانت الزاوية بين ( mathbf a ) و ( mathbf x- mathbf h ) يقع بين (- 90 ^ circ ) و (90 ^ circ ) ، أو ما يعادله ، إذا كان جيب التمام للزاوية أكبر من 0.

    وبالتالي نصنف ( mathbf x ) إلى عدد السكان 1 إذا ( mathbf a ^ top ( mathbf x- mathbf h) & gt0 ) ، وإلى السكان 2 إذا ( mathbf a ^ top ( mathbf x- mathbf h) & lt0 ).

    هذا الوضع موضح في الشكل 8.4.

    إذا كان لدينا أكثر من (2 ) من السكان ، إذن بالنسبة لـ ( boldsymbol < Sigma> = mathbf I ) ، فإن حدود القرار هي المنصفات العمودية بين النقط المركزية للسكان ( (< boldsymbol < mu >> _ i )) ونقوم ببساطة بتصنيفها إلى أقرب النقطه الوسطى.

    عندما ( boldsymbol < Sigma> not = mathbf I ) ، فإننا نفكر في ( boldsymbol < Sigma> ) كمساحة مشوهة. بدلاً من قياس المسافة باستخدام المسافة الإقليدية ، نقوم بدلاً من ذلك بضبط المسافات لحساب ( boldsymbol < Sigma> ). بعد ذلك ، لم تعد حدود القرار هي المنصفات العمودية للنقاط الوسطى.

    مثال 2

    ضع في اعتبارك الحالة ثنائية المتغير ( (p = 2 )) مع مجموعات (g = 2 ) ، حيث ( Pi_1 ) هو (N_2 (< boldsymbol < mu >> _ 1 ، mathbf I_2) ) التوزيع و ( Pi_2 ) هو التوزيع (N_2 (> _ 2، mathbf I_2) ). افترض (< boldsymbol < mu >> _ 1 = start ج 0 نهاية) و (< boldsymbol < mu >> _ 2 = start -c 0 end) لبعض الثوابت (c & gt0 ). هنا ، ( mathbf a = boldsymbol < Sigma> ^ <-1> (< boldsymbol < mu >> _ 1 - < boldsymbol < mu >> _ 2) = start 2 ج 0 نهاية) و ( mathbf h = frac <1> <2> (< boldsymbol < mu >> _ 1 + < boldsymbol < mu >> _ 2) = start 0 0 نهاية) .

    تخصص قاعدة تمييز ML ( mathbf x ) إلى ( Pi_1 ) إذا ( mathbf a ^ top ( mathbf x- mathbf h) = mathbf a ^ top mathbf x & gt 0 ) . إذا كتبنا ( mathbf x = start x_1 x_2 end) ثم ( mathbf a ^ top mathbf x = 2cx_1 ) ، وهو أكبر من الصفر إذا (x_1 & gt 0 ). ومن ثم نخصص ( mathbf x ) إلى ( Pi_1 ) إذا (x_1 & gt 0 ) ونخصص ( mathbf x ) إلى ( Pi_2 ) إذا (x_1 leq 0 ) .

    الشكل 8.4: LDA عندما تكون مصفوفة التغاير هي الهوية

    مثال 3

    لنقم الآن بتعميم المثال السابق ، مع عدم وضع افتراضات حول ( boldsymbol < Sigma> ) ، لكننا ما زلنا نفترض (< boldsymbol < mu >> _ 1 = - < boldsymbol < mu >> _ 2 ). إذا كتبنا ( mathbf a = start a_1 a_2 end) و ( mathbf h = frac <1> <2> (< boldsymbol < mu >> _ 1 + < boldsymbol < mu >> _ 2) = boldsymbol 0 ). ثم تخصص قاعدة تمييز ML ( mathbf x ) إلى ( Pi_1 ) إذا ( mathbf a ^ top mathbf x & gt 0 ). إذا كتبنا ( mathbf x = start x y end) ثم يتم إعطاء الحد الفاصل ( mathcal R_1 ) و ( mathcal R_2 ) بواسطة ( mathbf a ^ top mathbf x = start a_1 & amp a_2 end يبدأ x y end = a_1 x + a_2 y = 0 ) ، أي (y = - frac س ). هذا خط مستقيم يمر من نقطة الأصل بتدرج لوني (- a_1 / a_2 ).

    إذا كان تباين المكون (y ) صغيرًا جدًا مقارنةً بتباين المكون (x ) ، فسنبدأ في التصنيف فقط على أساس (y ). على سبيل المثال ، إذا (< boldsymbol < mu >> _ 1 = start2 1 النهاية) و ( boldsymbol < Sigma> = start1 & amp0.09 0.09 & amp0.1 النهاية) نجد ( mathbf a = start2.39 17.8 النهاية) وهو ما يعطي السطر (y = -0.13 x ). أي ، خط يقترب من أن يكون أفقيًا.

    8.1.4 أكثر من مجموعتين

    When (g>2) , the boundaries for the ML rule will be piece-wise linear. In the exercises you will look at an example with 3 populations in two dimensions.


    Minitab Express &ndash Frequency Tables

    To create a frequency table of dog ownership in Minitab Express:

    1. Open the data set:
      • FALL2016STDATA.MTW
    2. On a PC: In the menu bar select STATISTICS > Describe > Tally
    3. On a Mac: In the menu bar select Statistics > Summary Statistics > Tally
    4. Double click the variable Dog in the box on the left to insert the variable into the Variable box
    5. Under Statistics, check Counts
    6. Click OK

    This should result in the following frequency table:

    Tally
    Dog Count
    No 252
    Yes 272
    N= 524
    *= 1

    Select your operating system below to see a step-by-step guide for this example.


    8.1.1: Sample Spaces and Probability (Exercises) - Mathematics

    This chapter covers the most basic definitions of probability theory and explores some fundamental properties of the probability function.

    Our starting point is the concept of an abstract random experiment. This is an experiment whose outcome is not necessarily determined before it is conducted. Examples include flipping a coin, the outcome of a soccer match, and the weather. The set of all possible outcomes associated with the random experiment is called the sample space. Events are subsets of the sample space, or in other words sets of possible outcomes. The probability function assigns real values to events in a way that is consistent with our intuitive understanding of probability. Formal definitions appear below.

    A sample space can be finite, for example [Omega=<1,ldots,10>] in the experiment of observing a number from 1 to 10. Or $Omega$ can be countably-infinite, for example [Omega=<0,1,2,3,ldots>] in the experiment of counting the number of phone calls made on a specific day. A sample space may also be uncountably infinite, for example [Omega=] in the experiment of measuring the height of a passer-by.

    The notation $mathbb$ corresponds to the natural numbers $<1,2,3,ldots>$, and the notation $mathbbcup<0>$ corresponds to the set $<0,1,2,3,ldots>$. The notation $R$ corresponds to the real numbers and the notation $$ corresponds to the non-negative real numbers. See Chapter A in the appendix for an overview of set theory, including the notions of a power set and countably infinite and unconuntably infinite sets.

    In the examples above, the sample space contained unachievable values (number of people and height are bounded numbers). A more careful definition could have been used, taking into account bounds on the number of potential phone calls or potential height values. For the sake of simplicity, we often use simpler sample spaces containing some unachievable outcomes. This is not a significant problem, since we can later assign zero probability to such values.

    In particular, the empty set $emptyset$ and the sample space $Omega$ are events. Figure 1.2.1 shows an example of a sample space $Omega$ and two events $A,BsubsetOmega$ that are neither $emptyset$ nor $Omega$. The R code below shows all possible events of an experiment with $Omega=$. There are $2^<|Omega|>$ such sets, assuming $Omega$ is finite (see Chapter A on set theory for more information on the power set).

    For an event $E$, the outcome of the random experiment $omegainOmega$ is either in E $(omegain E)$ or not in $E$ $(omega otin E)$. In the first case, we say that the event $E$ occurred, and in the second case we say that the event $E$ did not occur. $Acup B$ is the event of either $A$ or $B$ occurring and $Acap B$ is the event of both $A$ and $B$ occurring. The complement $A^c$ (in the complement, the universal set is taken to be $Omega$: $A^c=Omegasetminus A)$ represents the event that $A$ did not occur. If the events $A,B$ are disjoint $(Acap B=emptyset)$, the two events cannot happen at the same time, since no outcome of the random experiment belongs to both $A$ and $B$. If $Asubset B$, then $B$ occurring implies that $A$ occurs as well.


    3.6 Variance and standard deviation

    The variance of a random variable measures the spread of the variable around its expected value. Rvs with large variance can be quite far from their expected values, while rvs with small variance stay near their expected value. The standard deviation is simply the square root of the variance. The standard deviation also measures spread, but in more natural units which match the units of the random variable itself.

    Let (X) be a random variable with expected value (mu = E[X]) . ال variance of (X) is defined as [ ext(X) = E[(X - mu)^2] ] The standard deviation of (X) is written (sigma(X)) and is the square root of the variance: [ sigma(X) = sqrt< ext(X)> ]

    Note that the variance of an rv is always positive (in the French sense 11 ), as it is the integral or sum of a positive function.

    The next theorem gives a formula for the variance that is often easier than the definition when performing computations.

    Applying linearity of expected values (Theorem 5.8) to the definition of variance yields: [ egin E[(X - mu)^2] &= E[X^2 - 2mu X + mu^2] &= E[X^2] - 2mu E[X] + mu^2 = E[X^2] - 2mu^2 + mu^2 &= E[X^2] - mu^2, end ] as desired.

    Let (X sim ext(3,0.5)) . Here (mu = E[X] = 1.5) . In Example 5.35, we saw that (E[(X-1.5)^2] = 0.75) . Then ( ext(X) = 0.75) and the standard deviation is (sigma(X) = sqrt <0.75>approx 0.866) . We can check both of these using simulation and the built in R functions var and sd :

    Compute the variance of (X) if the pdf of (X) is given by (f(x) = e^<-x>) , (x > 0) .

    We have already seen that (E[X] = 1) and (E[X^2] = 2) (Example 5.37). Therefore, the variance of (X) is [ ext(X) = E[X^2] - E[X]^2 = 2 - 1 = 1. ] The standard deviation (sigma(X) = sqrt <1>= 1) . We interpret of the standard deviation (sigma) as a spread around the mean, as shown in this picture:

    Compute the standard deviation of the uniform random variable (X) on ([0,1]) . [ egin ext(X) &= E[X^2] - E[X]^2 = int_0^1x^2 cdot 1, dx - left(frac<1><2> ight)^2 &= frac<1> <3>- frac<1> <4>= frac<1> <12>approx 0.083. end ] So the standard deviation is (sigma(X) = sqrt <1/12>approx 0.289) . Shown as a spread around the mean of 1/2:

    For many distributions, most of the values will lie within one standard deviation of the mean, i.e. within the spread shown in the example pictures. Almost all of the values will lie within 2 standard deviations of the mean. What do we mean by “almost all”? Well, 85% would be almost all. 15% would not be almost all. This is a very vague rule of thumb. Chebychev’s Theorem is a more precise statement. It says in particular that the probability of being more than 2 standard deviations away from the mean is at most 25%.

    Sometimes, you know that the data you collect will likely fall in a certain range of values. For example, if you are measuring the height in inches of 100 randomly selected adult males, you would be able to guess that your data will very likely lie in the interval 60-84. You can get a rough estimate of the standard deviation by taking the expected range of values and dividing by 6 in this case it would be 24/6 = 4. Here, we are using the heuristic that it is very rare for data to fall more than three standard deviations from the mean. This can be useful as a quick check on your computations.

    Unlike expected value, variance and standard deviation are not linear. However, variance and standard deviation do have scaling properties, and variance does distribute over sums in the special case of independent random variables:

    Let (X) be a rv and (c) a constant. Then [ egin ext(cX) &= c^2 ext(X) sigma(cX) &= c sigma(X) end ]

    Let (X) and (Y) be independent random variables. Then [ < m Var>(aX + bY) = a^2 < m Var>(X) + b^2 < m Var>(Y) ]

    We prove part 1 here, and verify part 2 through simulation in Exercise 5.37. [يبدأ < m Var>(cX) =& E[(cX)^2] - E[cX]^2 = c^2E[X^2] - (cE[X])^2 =&c^2igl(E[X^2] - E[X]^2) = c^2< m Var>(X) end]

    Theorem 5.10 part 2 is only true when (X) and (Y) are independent.

    If (X) and (Y) are independent, then (< m Var>(X - Y) = < m Var>(X) + < m Var>(Y)) .

    Let (X sim ext(n, p)) . We have seen that (X = sum_^n X_i) , where (X_i) are independent Bernoulli random variables. Therefore,

    [يبدأ < ext >(X) &= < ext >(sum_^n X_i) &= sum_^n < ext >(X_i) &= sum_^n p(1 - p) = np(1-p) end] where we have used that the variance of a Bernoulli random variable is (p(1- p)) . Indeed, (E[X_i^2] -E[X_i]^2 = p - p^2 = p(1 - p)) .


    1 Answer 1

    Just as for rolling two ordinary dice, the sample space consists of a $6 imes 6$ of pairs of faces.

    Enumeration: For the sum $S$ on the two dice, each of the 36 cells can also be labeled with the total of the two corresponding faces. Then count the cells for each total. (The first two of the six rows are shown below.)

    Analytic methods: It is easy to show that $E(S) = E(D_a) + E(D_b) = 15/6 + 27/6 = 42/6 = 3.5,$ which is the same as for regular dice. A bit more tediously, one can show that $Var(S)$ is the same as for regular dice. 'Probability generating functions' could be used to show that the distribution of $S$ agrees with the (triangular) distribution of the sum of two ordinary dice.

    Simulation: The distribution of $S$ can be very closely approximated by simulating the sums on a million rolls of these two special dice and tallying the results. (Simulation in R statistical software gives probabilities accurate to about three places.)

    The plot below shows a histogram of the million simulated totals obtained when rolling a pair of these special dice. The dots show the exact distribution.


    4.5 Probability and Statistics

    Modern science may be characterized by a systematic collection of empirical measurements and the attempt to model laws of nature using mathematical language. The drive to deliver better measurements led to the development of more accurate and more sensitive measurement tools. Nonetheless, at some point it became apparent that measurements may not be perfectly reproducible and any repeated measurement of presumably the exact same phenomena will typically produce variability in the outcomes. On the other hand, scientists also found that there are general laws that govern this variability in repetitions. For example, it was discovered that the average of several independent repeats of the measurement is less variable and more reproducible than each of the single measurements themselves.

    Probability was first introduced as a branch of mathematics in the investigation of uncertainty associated with gambling and games of chance. During the early 19th century probability began to be used in order to model variability in measurements. This application of probability turned out to be very successful. Indeed, one of the major achievements of probability was the development of the mathematical theory that explains the phenomena of reduced variability that is observed when averages are used instead of single measurements. In Chapter 7 we discuss the conclusions of this theory.

    Statistics study method for inference based on data. Probability serves as the mathematical foundation for the development of statistical theory. In this chapter we introduced the probabilistic concept of a random variable. This concept is key for understanding statistics. In the rest of Part I of this book we discuss the probability theory that is used for statistical inference. Statistical inference itself is discussed in Part II of the book.


    شاهد الفيديو: تصحيح تمرين 1 حول درس حساب الاحتمالات Probabilité exercice 1 (شهر نوفمبر 2021).