چکیده ها بیانیه داستان

توزیع دو جمله ای یک متغیر تصادفی گسسته. توزیع دو جمله ای تابع تولید توزیع دو جمله ای

در این پست و چند پست بعدی به مدل های ریاضی رویدادهای تصادفی خواهیم پرداخت. مدل ریاضییک عبارت ریاضی است که یک متغیر تصادفی را نشان می دهد. برای متغیرهای تصادفی گسسته، این عبارت ریاضی به عنوان تابع توزیع شناخته می شود.

اگر مشکل به شما اجازه می دهد که به صراحت یک عبارت ریاضی را که نشان دهنده یک متغیر تصادفی است بنویسید، می توانید احتمال دقیق هر یک از مقادیر آن را محاسبه کنید. در این حالت می توانید تمام مقادیر تابع توزیع را محاسبه و فهرست کنید. توزیع های متنوعی از متغیرهای تصادفی در کاربردهای تجاری، جامعه شناختی و پزشکی مشاهده می شود. یکی از مفیدترین توزیع ها دوجمله ای است.

توزیع دو جمله ایبرای شبیه سازی موقعیت هایی که با ویژگی های زیر مشخص می شوند استفاده می شود.

  • نمونه از تعداد ثابتی از عناصر تشکیل شده است n، نشان دهنده نتایج یک آزمون خاص است.
  • هر عنصر نمونه متعلق به یکی از دو دسته متقابل منحصر به فرد است که کل فضای نمونه را خسته می کند. به طور معمول این دو دسته موفقیت و شکست نامیده می شوند.
  • احتمال موفقیت آرثابت است بنابراین، احتمال شکست است 1 - ص.
  • نتیجه (یعنی موفقیت یا شکست) هر آزمایشی به نتیجه آزمایش دیگری بستگی ندارد. برای اطمینان از استقلال نتایج، عناصر نمونه معمولاً با استفاده از دو روش مختلف به دست می‌آیند. هر عنصر نمونه به طور تصادفی از یک نامتناهی استخراج می شود جمعیتبدون بازگشت یا از یک جمعیت محدود با بازگشت.

یادداشت را با فرمت یا نمونه ها در قالب دانلود کنید

توزیع دو جمله ای برای تخمین تعداد موفقیت ها در یک نمونه متشکل از استفاده می شود nمشاهدات بیایید سفارش را به عنوان مثال در نظر بگیریم. مشتریان شرکت ساکسون برای ثبت سفارش می توانند از فرم الکترونیکی تعاملی استفاده کرده و آن را برای شرکت ارسال کنند. سپس سیستم اطلاعاتی خطا، اطلاعات ناقص یا نادرست در سفارشات را بررسی می کند. هر سفارش مورد نظر علامت گذاری شده و در گزارش استثنای روزانه گنجانده شده است. داده های جمع آوری شده توسط شرکت نشان می دهد که احتمال خطا در سفارشات 0.1 است. یک شرکت مایل است بداند که احتمال یافتن تعداد معینی از سفارشات اشتباه در یک نمونه مشخص چقدر است. به عنوان مثال، فرض کنید مشتریان چهار را تکمیل کردند فرم های الکترونیکی. احتمال اینکه همه سفارشات بدون خطا باشد چقدر است؟ چگونه این احتمال را محاسبه کنیم؟ با موفقیت، خطا را هنگام پر کردن فرم درک خواهیم کرد و سایر نتایج شکست تلقی خواهند شد. به یاد داشته باشید که ما به تعداد سفارشات اشتباه در یک نمونه معین علاقه مند هستیم.

چه نتایجی را می توانیم ببینیم؟ اگر نمونه از چهار مرتبه تشکیل شده باشد، ممکن است یک، دو، سه یا هر چهار مرتبه نادرست باشد و ممکن است همه آنها صحیح باشند. آیا یک متغیر تصادفی که تعداد فرم های اشتباه تکمیل شده را توصیف می کند، می تواند مقدار دیگری داشته باشد؟ این امکان پذیر نیست زیرا تعداد فرم های نادرست نمی تواند از حجم نمونه بیشتر شود nیا منفی باشد بنابراین، یک متغیر تصادفی که از قانون توزیع دوجمله ای پیروی می کند، مقادیری از 0 تا را می گیرد n.

فرض کنید در یک نمونه از چهار مرتبه نتایج زیر مشاهده می شود:

احتمال یافتن سه مرتبه اشتباه در یک نمونه چهار مرتبه، به ترتیب مشخص شده چقدر است؟ از آنجایی که تحقیقات اولیه نشان داده است که احتمال خطا هنگام پر کردن فرم 0.10 است، احتمال نتایج فوق به صورت زیر محاسبه می شود:

از آنجایی که نتایج به یکدیگر وابسته نیستند، احتمال توالی مشخص شده از نتایج برابر است با: p*p*(1–p)*p = 0.1*0.1*0.9*0.1 = 0.0009. اگر نیاز به محاسبه تعداد انتخاب دارید ایکس nعناصر، باید از فرمول ترکیبی (1) استفاده کنید:

کجا n! = n * (n –1) * (n – 2) * … * 2 * 1 - فاکتوریل یک عدد n، و 0! = 1 و 1! = 1 طبق تعریف

این عبارت اغلب به عنوان . بنابراین، اگر n = 4 و X = 3 باشد، تعداد دنباله های متشکل از سه عنصر استخراج شده از حجم نمونه 4 با فرمول زیر تعیین می شود:

بنابراین، احتمال تشخیص سه دستور اشتباه به صورت زیر محاسبه می شود:

(تعداد دنباله های ممکن) *
(احتمال یک دنباله خاص) = 4 * 0.0009 = 0.0036

به همین ترتیب، می توانید احتمال اینکه از بین چهار ترتیب یک یا دو اشتباه وجود داشته باشد و همچنین احتمال اشتباه بودن یا درست بودن همه ترتیبات را محاسبه کنید. اما با افزایش حجم نمونه nتعیین احتمال یک توالی خاص از نتایج دشوارتر می شود. در این مورد، شما باید مدل ریاضی مناسبی را که توزیع دوجمله ای تعداد انتخاب ها را توصیف می کند، اعمال کنید. ایکساشیاء از یک انتخاب شامل nعناصر.

توزیع دو جمله ای

جایی که P(X)- احتمال ایکسموفقیت برای یک حجم نمونه معین nو احتمال موفقیت آر, ایکس = 0, 1, … n.

لطفاً توجه داشته باشید که فرمول (2) رسمی سازی نتیجه گیری های شهودی است. مقدار تصادفی ایکس، که از توزیع دو جمله ای تبعیت می کند، می تواند هر عدد صحیحی را در محدوده 0 تا داشته باشد n. کار کنید آرایکس(1 – p)nایکسنشان دهنده احتمال یک دنباله خاص متشکل از ایکسموفقیت در حجم نمونه برابر است n. مقدار تعداد ترکیبات ممکن را تعیین می کند ایکسموفقیت در nتست ها بنابراین، برای تعداد معینی از آزمایشات nو احتمال موفقیت آراحتمال یک دنباله متشکل از ایکسموفقیت، برابر

P(X) = (تعداد دنباله های ممکن) * (احتمال یک دنباله خاص) =

اجازه دهید نمونه هایی را در نظر بگیریم که کاربرد فرمول (2) را نشان می دهد.

1. فرض کنید احتمال پرکردن اشتباه فرم 0.1 باشد. احتمال اینکه از بین چهار فرم تکمیل شده، سه مورد نادرست باشد چقدر است؟ با استفاده از فرمول (2) متوجه می شویم که احتمال تشخیص سه مرتبه اشتباه در نمونه ای متشکل از چهار مرتبه برابر است با

2. فرض کنید احتمال پرکردن نادرست فرم 0.1 باشد. احتمال اینکه از بین چهار فرم تکمیل شده حداقل سه مورد نادرست باشد چقدر است؟ همانطور که در مثال قبل نشان داده شد، احتمال اینکه از بین چهار فرم تکمیل شده، سه فرم نادرست باشد 0.0036 است. برای محاسبه احتمال اینکه از بین چهار فرم تکمیل شده حداقل سه فرم نادرست باشد، باید احتمال اینکه از بین چهار فرم تکمیل شده سه نادرست باشد و احتمال اینکه از بین چهار فرم تکمیل شده همه نادرست باشند را اضافه کنید. احتمال رخداد دوم است

بنابراین، احتمال اینکه از بین چهار فرم تکمیل شده حداقل سه مورد نادرست باشد برابر است

P(X > 3) = P(X = 3) + P(X = 4) = 0.0036 + 0.0001 = 0.0037

3. فرض کنید احتمال پرکردن اشتباه فرم 0.1 باشد. احتمال اینکه از چهار فرم تکمیل شده کمتر از سه فرم نادرست باشد چقدر است؟ احتمال این اتفاق

P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

با استفاده از فرمول (2) هر یک از این احتمالات را محاسبه می کنیم:

بنابراین، P(X< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

احتمال P(X< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. سپس P(X< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

با افزایش حجم نمونه nمحاسبات مشابه آنچه در مثال 3 انجام شد دشوار می شود. برای جلوگیری از این عوارض، بسیاری از احتمالات دو جمله ای از قبل جدول بندی شده اند. برخی از این احتمالات در شکل نشان داده شده است. 1. مثلاً برای بدست آوردن این احتمال که ایکس= 2 در n= 4 و پ= 0.1، باید عددی را که در تقاطع خط قرار دارد از جدول استخراج کنید ایکس= 2 و ستون آر = 0,1.

برنج. 1. احتمال دو جمله ای در n = 4, ایکس= 2 و آر = 0,1

توزیع دوجمله ای را می توان با استفاده از تابع Excel =BINOM.DIST() (شکل 2) محاسبه کرد که دارای 4 پارامتر است: تعداد موفقیت ها - ایکستعداد تست ها (یا حجم نمونه) – nاحتمال موفقیت – آر، پارامتر انتگرال، که مقدار TRUE را می گیرد (در این حالت احتمال محاسبه می شود نه کمتر ایکسرویدادها) یا FALSE (در این مورد احتمال محاسبه می شود دقیقا ایکسمناسبت ها).

برنج. 2. پارامترهای تابع =BINOM.DIST()

برای سه مثال بالا، محاسبات در شکل نشان داده شده است. 3 (به فایل اکسل نیز مراجعه کنید). هر ستون شامل یک فرمول است. اعداد پاسخ نمونه های عدد مربوطه را نشان می دهند).

برنج. 3. محاسبه توزیع دو جمله ای در اکسل برای n= 4 و پ = 0,1

ویژگی های توزیع دو جمله ای

توزیع دو جمله ای به پارامترها بستگی دارد nو آر. توزیع دو جمله ای می تواند متقارن یا نامتقارن باشد. اگر p = 0.05، توزیع دوجمله ای بدون توجه به مقدار پارامتر متقارن است. n. با این حال، اگر p ≠ 0.05، توزیع کج می شود. هر چه مقدار پارامتر نزدیکتر باشد آربه 0.05 و اندازه نمونه بزرگتر است n، عدم تقارن توزیع کمتر مشخص می شود. بنابراین، توزیع تعداد فرم های نادرست تکمیل شده به سمت راست منحرف می شود زیرا پ= 0.1 (شکل 4).

برنج. 4. هیستوگرام توزیع دوجمله ای در n= 4 و پ = 0,1

انتظار توزیع دوجمله ایبرابر حاصلضرب حجم نمونه nدر مورد احتمال موفقیت آر:

(3) M = E(X) =n.p.

به طور متوسط، با یک سری آزمایش به اندازه کافی طولانی در یک نمونه متشکل از چهار مرتبه، ممکن است P = E(X) = 4 x 0.1 = 0.4 فرم های اشتباه تکمیل شده وجود داشته باشد.

انحراف استاندارد توزیع دو جمله ای

به عنوان مثال، انحراف معیار تعداد فرم های اشتباه تکمیل شده در یک حسابداری سیستم اطلاعاتبرابر است با:

از مطالب کتاب لوین و همکاران آمار برای مدیران استفاده شده است. - م.: ویلیامز، 2004. - ص. 307-313

همه پدیده ها در مقیاس کمی مانند 1، 2، 3... 100500 اندازه گیری نمی شوند... یک پدیده همیشه نمی تواند تعداد بی نهایت یا زیاد حالت های مختلف به خود بگیرد. به عنوان مثال، جنسیت یک فرد می تواند M یا F باشد. تیرانداز یا به هدف می زند یا از دست می دهد. شما می توانید به هر دو به " موافق " یا " مخالف " و غیره رای دهید. و غیره به عبارت دیگر، چنین داده هایی وضعیت یک ویژگی جایگزین را منعکس می کنند - یا "بله" (رویداد رخ داده است) یا "نه" (رویداد رخ نداده است). رویداد رخ داده (نتیجه مثبت) نیز "موفقیت" نامیده می شود.

آزمایش با چنین داده هایی نامیده می شود طرح برنولی، به افتخار ریاضیدان معروف سوئیسی که تأسیس کرد که وقتی مقادیر زیادآزمون‌ها، نسبت پیامدهای مثبت و تعداد کل آزمایش‌ها به احتمال وقوع این رویداد تمایل دارد.

متغیر مشخصه جایگزین

به منظور استفاده از دستگاه ریاضی در تجزیه و تحلیل، نتایج چنین مشاهداتی باید در ثبت شود فرم عددی. برای انجام این کار، به یک نتیجه مثبت عدد 1 اختصاص داده می شود، یک نتیجه منفی - 0. به عبارت دیگر، ما با متغیری روبرو هستیم که فقط می تواند دو مقدار داشته باشد: 0 یا 1.

چه سودی از این می توان گرفت؟ در واقع، کمتر از داده های معمولی نیست. بنابراین، محاسبه تعداد نتایج مثبت آسان است - فقط تمام مقادیر را جمع کنید، یعنی. همه 1 (موفقیت). می‌توانید جلوتر بروید، اما برای این کار باید چند نماد را معرفی کنید.

اولین چیزی که باید به آن توجه کرد این است که نتایج مثبت (که برابر با 1 است) احتمال وقوع دارند. به عنوان مثال، گرفتن سر هنگام پرتاب سکه ½ یا 0.5 است. این احتمال به طور سنتی با حرف لاتین نشان داده می شود پ. بنابراین، احتمال وقوع یک رویداد جایگزین برابر است با 1 - ص، که با آن نیز مشخص می شود q، به این معنا که q = 1 - p. این نمادها را می توان به وضوح در قالب یک جدول توزیع متغیر سیستماتیک کرد ایکس.

ما لیستی از مقادیر ممکن و احتمالات آنها را دریافت کردیم. قابل محاسبه است ارزش مورد انتظار و پراکندگی. انتظار عبارت است از مجموع محصولات تمام مقادیر ممکن و احتمالات مربوط به آنها:

بیایید انتظار را با استفاده از نماد در جداول بالا محاسبه کنیم.

به نظر می رسد که انتظار ریاضی از یک علامت جایگزین برابر با احتمال این رویداد است - پ.

حال بیایید تعریف کنیم که واریانس یک ویژگی جایگزین چیست. پراکندگی میانگین مجذور انحرافات از انتظارات ریاضی است. فرمول کلی(برای داده های گسسته) به شکل زیر است:

بنابراین واریانس ویژگی جایگزین:

به راحتی می توان دریافت که این پراکندگی حداکثر 0.25 (با p=0.5).

انحراف معیار ریشه واریانس است:

حداکثر مقدار از 0.5 تجاوز نمی کند.

همانطور که می بینید، هم انتظار ریاضی و هم واریانس ویژگی جایگزین شکل بسیار فشرده ای دارند.

توزیع دو جمله ای یک متغیر تصادفی

بیایید از زاویه دیگری به وضعیت نگاه کنیم. در واقع، چه کسی اهمیت می دهد که میانگین از دست دادن سر در هر پرتاب 0.5 باشد؟ حتی تصورش غیرممکن است. جالب تر است که این سؤال را در مورد تعداد ضربه هایی که برای تعداد مشخصی از پرتاب ها رخ می دهد بپرسیم.

به عبارت دیگر، محقق اغلب به احتمال وقوع تعداد معینی از رویدادهای موفق علاقه مند است. این ممکن است تعداد محصولات معیوب در دسته آزمایش شده (1 - معیوب، 0 - خوب) یا تعداد بهبودی (1 - سالم، 0 - بیمار) و غیره باشد. تعداد این "موفقیت ها" برابر با مجموع همه مقادیر متغیر خواهد بود ایکس، یعنی تعداد نتایج منفرد

مقدار تصادفی بدو جمله ای نامیده می شود و مقادیر از 0 تا را می گیرد n(در ب= 0 - همه قطعات مناسب هستند، با ب = n- همه قطعات معیوب هستند). فرض بر این است که تمام مقادیر ایکسمستقل از یکدیگر بیایید ویژگی های اصلی یک متغیر دوجمله ای را در نظر بگیریم، یعنی انتظار، پراکندگی و توزیع ریاضی آن را مشخص کنیم.

انتظار یک متغیر دو جمله ای بسیار آسان است. انتظار ریاضی از مجموع کمیت ها، مجموع انتظارات ریاضی از هر کمیت اضافه شده است و برای همه یکسان است، بنابراین:

به عنوان مثال، انتظار ریاضی تعداد سرهای رها شده در 100 پرتاب، 100 × 0.5 = 50 است.

اکنون فرمول پراکندگی یک متغیر دو جمله ای را استخراج می کنیم. واریانس مجموع متغیرهای تصادفی مستقل، مجموع واریانس ها است. از اینجا

انحراف معیار به ترتیب

برای 100 پرتاب سکه، انحراف معیار تعداد سرها است

در نهایت، توزیع مقدار دو جمله ای را در نظر بگیرید. احتمال اینکه متغیر تصادفی است بارزش های متفاوتی به خود خواهد گرفت ک، جایی که 0≤k≤n. برای یک سکه، این مشکل ممکن است به این صورت باشد: احتمال بدست آوردن 40 سر در 100 پرتاب چقدر است؟

برای درک روش محاسبه، تصور کنید که سکه فقط 4 بار پرتاب شده است. هر یک از طرفین می تواند هر بار سقوط کند. از خود می پرسیم: احتمال اینکه از 4 پرتاب 2 سر به دست بیاوریم چقدر است. هر پرتاب مستقل از یکدیگر است. این بدان معنی است که احتمال بدست آوردن هر ترکیبی برابر است با حاصل ضرب احتمالات یک نتیجه معین برای هر پرتاب فردی. بگذارید O سر باشد، P دم باشد. سپس، برای مثال، یکی از ترکیب‌هایی که برای ما مناسب است ممکن است شبیه OOPP باشد، یعنی:

احتمال چنین ترکیبی برابر است با حاصل ضرب دو احتمال هد گرفتن و دو احتمال دیگر نگرفتن هد (رویداد معکوس، محاسبه شده به صورت 1 - ص) یعنی 0.5×0.5×(1-0.5)×(1-0.5)=0.0625. این احتمال یکی از ترکیباتی است که برای ما مناسب است. اما سوال در مورد تعداد کل عقاب ها بود و نه در مورد تعدادی به ترتیب خاصی. سپس باید احتمالات همه ترکیباتی را که دقیقاً 2 سر وجود دارد را جمع آوری کنید. واضح است که همه آنها یکسان هستند (با تغییر عوامل، محصول تغییر نمی کند). بنابراین، شما باید تعداد آنها را محاسبه کنید و سپس در احتمال چنین ترکیبی ضرب کنید. بیایید تمام ترکیبات 4 پرتاب 2 سر را بشماریم: RROO، RORO، ROOR، ORRO، OROR، OORR. در کل 6 گزینه وجود دارد.

بنابراین احتمال مورد نظر گرفتن 2 سر بعد از 4 پرتاب 6×0.0625=0.375 است.

با این حال، شمارش به این روش خسته کننده است. در حال حاضر برای 10 سکه، به دست آوردن تعداد کل گزینه ها با نیروی بی رحم بسیار دشوار خواهد بود. بنابراین، افراد باهوش مدت‌ها پیش فرمولی اختراع کردند که با آن تعداد ترکیب‌های مختلف را محاسبه می‌کردند nعناصر توسط ک، جایی که n- تعداد کل عناصر، ک- تعداد عناصری که گزینه های چیدمان آنها شمارش می شود. فرمول ترکیبی از nعناصر توسط کاین است:

موارد مشابه در بخش ترکیبیات اتفاق می افتد. من هرکسی را که بخواهد دانش خود را ارتقا دهد به آنجا می فرستم. از این رو، به هر حال، نام توزیع دو جمله ای (فرمول بالا ضریبی در بسط دو جمله ای نیوتن است).

فرمول تعیین احتمال را می توان به راحتی به هر کمیت تعمیم داد nو ک. در نتیجه فرمول توزیع دوجمله ای شکل زیر را دارد.

تعداد ترکیب هایی که شرایط را برآورده می کنند در احتمال یکی از آنها ضرب می شود.

برای استفاده عملی، فقط دانستن فرمول توزیع دو جمله ای کافی است. یا حتی ممکن است ندانید - در زیر نحوه تعیین احتمال با استفاده از Excel را نشان می دهیم. اما بهتر است بدانیم

با استفاده از این فرمول، احتمال بدست آوردن 40 سر در 100 پرتاب را محاسبه می کنیم:

یا فقط 1.08٪. برای مقایسه، احتمال انتظار ریاضی این آزمایش، یعنی 50 سر، برابر با 7.96 درصد است. حداکثر احتمال یک مقدار دو جمله ای به مقدار مربوط به انتظار ریاضی تعلق دارد.

محاسبه احتمال توزیع دو جمله ای در اکسل

اگر فقط از کاغذ و ماشین حساب استفاده می کنید، محاسبات با استفاده از فرمول توزیع دو جمله ای، با وجود عدم وجود انتگرال، بسیار دشوار است. مثلا مقدار 100 است! - دارای بیش از 150 کاراکتر پیش از این و حتی اکنون نیز از فرمول های تقریبی برای محاسبه چنین مقادیری استفاده می شد. در حال حاضر توصیه می شود از نرم افزارهای خاصی مانند MS Excel استفاده کنید. بنابراین، هر کاربر (حتی یک انسان گرا با آموزش) می تواند به راحتی احتمال یک مقدار توزیع شده دو جمله ای را محاسبه کند. متغیر تصادفی.

برای ادغام مطالب، فعلاً از Excel به عنوان یک ماشین حساب معمولی استفاده می کنیم. بیایید یک محاسبه گام به گام را با استفاده از فرمول توزیع دو جمله ای انجام دهیم. بیایید مثلاً احتمال 50 سر را محاسبه کنیم. در زیر تصویری با مراحل محاسبه و نتیجه نهایی آمده است.

همانطور که می بینید، نتایج میانی به اندازه ای هستند که در سلول جا نمی شوند، اگرچه در همه جا استفاده می شوند. توابع سادهانواع: FACTOR (محاسبه فاکتوریل)، POWER (بالا بردن عدد به توان)، و همچنین عملگرهای ضرب و تقسیم. علاوه بر این، این محاسبه بسیار دست و پا گیر است؛ در هر صورت، فشرده نیست، زیرا بسیاری از سلول ها درگیر هستند. بله، و فهمیدن فوراً کمی دشوار است.

به طور کلی، اکسل یک تابع آماده برای محاسبه احتمالات یک توزیع دو جمله ای ارائه می دهد. تابع فراخوانی می شود BINOM.DIST.

تعداد موفقیت ها - تعداد تست های موفق ما 50 تا از آنها داریم.

تعداد تست ها – تعداد پرتاب: 100 بار.

احتمال موفقیت - احتمال به دست آوردن سر در یک پرتاب 0.5 است.

انتگرال - 1 یا 0 نشان داده شده است.اگر 0 باشد، احتمال محاسبه می شود P(B=k); اگر 1 باشد، تابع توزیع دو جمله ای محاسبه می شود، یعنی. مجموع همه احتمالات از B=0قبل از B=kشامل.

روی OK کلیک کنید و همان نتیجه بالا را بگیرید، فقط همه چیز با یک تابع محاسبه شد.

خیلی راحت برای آزمایش، به جای آخرین پارامتر 0، 1 را قرار می دهیم. 0.5398 به دست می آید. این به این معنی است که با پرتاب 100 سکه، احتمال گرفتن سر بین 0 تا 50 تقریباً 54٪ است. اما در ابتدا به نظر می رسید که باید 50 درصد باشد. به طور کلی، محاسبات به سرعت و به راحتی انجام می شود.

یک تحلیلگر واقعی باید بفهمد که تابع چگونه رفتار می کند (توزیع آن چقدر است)، بنابراین ما احتمالات را برای همه مقادیر از 0 تا 100 محاسبه می کنیم. یعنی ما این سوال را می پرسیم: احتمال اینکه یک عقاب وجود نداشته باشد چقدر است. ظاهر می شود، که 1 عقاب ظاهر می شود، 2، 3، 50، 90 یا 100. محاسبه در تصویر زیر نشان داده شده است. خط آبی خود توزیع دوجمله ای است، نقطه قرمز احتمال تعداد معینی از موفقیت k است.

ممکن است کسی بپرسد که آیا توزیع دوجمله ای شبیه به ... بله، بسیار شبیه است. حتی مویور (در سال 1733) گفت که توزیع دوجمله‌ای با نمونه‌های بزرگ نزدیک می‌شود (من نمی‌دانم در آن زمان چه نامی داشت)، اما کسی به او گوش نکرد. تنها گاوس، و سپس لاپلاس 60-70 سال بعد، دوباره کشف و به دقت مورد مطالعه قرار گرفتند. قانون عادیتوزیع ها نمودار بالا به وضوح نشان می دهد که حداکثر احتمال بر روی انتظارات ریاضی قرار می گیرد و با انحراف از آن، به شدت کاهش می یابد. درست مثل قانون عادی.

توزیع دو جمله ای اهمیت عملی زیادی دارد و اغلب اتفاق می افتد. با استفاده از اکسل، محاسبات به سرعت و به راحتی انجام می شود.

توزیع دو جمله ای یکی از مهم ترین توزیع های احتمال یک متغیر تصادفی گسسته متغیر است. توزیع دو جمله ای توزیع احتمال عدد است متروقوع یک رویداد آ V nمشاهدات مستقل متقابل. اغلب یک رویداد آ"موفقیت" یک مشاهده نامیده می شود و رویداد مخالف "شکست" نامیده می شود، اما این نامگذاری بسیار مشروط است.

شرایط توزیع دو جمله ای:

  • در مجموع انجام شد nآزمایشاتی که در آن رویداد آممکن است رخ دهد یا نباشد؛
  • رویداد آدر هر آزمایشی می تواند با همان احتمال رخ دهد پ;
  • تست ها متقابل مستقل هستند.

احتمال اینکه در nرویداد تست آدقیقا خواهد آمد متربار را می توان با استفاده از فرمول برنولی محاسبه کرد:

جایی که پ- احتمال وقوع یک رویداد آ;

q = 1 - پ- احتمال وقوع رویداد مخالف.

بیایید آن را بفهمیم چرا توزیع دوجمله ای با فرمول برنولی به روشی که در بالا توضیح داده شد مرتبط است؟ . رویداد - تعداد موفقیت ها در nآزمون ها به تعدادی گزینه تقسیم می شوند که در هر کدام موفقیت حاصل می شود مترتست ها و شکست - در n - مترتست ها بیایید یکی از این گزینه ها را در نظر بگیریم - ب1 . با استفاده از قانون جمع کردن احتمالات، احتمالات وقایع متضاد را ضرب می کنیم:

,

و اگر اشاره کنیم q = 1 - پ، آن

.

هر گزینه دیگری که در آن مترموفقیت و n - مترشکست ها تعداد چنین گزینه هایی برابر با تعداد راه هایی است که فرد می تواند nتست گرفتن مترموفقیت

مجموع همه احتمالات متراعداد وقوع رویداد آ(اعداد از 0 تا n) برابر با یک است:

که در آن هر جمله بیانگر یک عبارت در دوجمله ای نیوتن است. بنابراین توزیع مورد نظر را توزیع دو جمله ای می نامند.

در عمل، اغلب لازم است که احتمالات را "بیشتر از مترموفقیت در nتست ها» یا «حداقل مترموفقیت در nبرای این کار از فرمول های زیر استفاده می شود.

تابع انتگرال، یعنی احتمال اف(متر) آنچه در آن است nرویداد رصدی آدیگر نخواهد آمد متریک باررا می توان با استفاده از فرمول محاسبه کرد:

در نوبتش احتمال اف(≥متر) آنچه در آن است nرویداد رصدی آکمتر نخواهد آمد متریک بار، با فرمول محاسبه می شود:

گاهی اوقات محاسبه احتمال آن راحت تر است nرویداد رصدی آدیگر نخواهد آمد متربارها، از طریق احتمال رویداد مخالف:

.

اینکه کدام فرمول استفاده شود بستگی به این دارد که مجموع عبارت‌های کمتری در کدام یک از آنها باشد.

مشخصات توزیع دو جمله ای با استفاده از فرمول های زیر محاسبه می شود .

ارزش مورد انتظار: .

پراکندگی: .

انحراف معیار: .

توزیع دو جمله ای و محاسبات در MS Excel

احتمال دو جمله ای پ n ( متر) و مقادیر تابع انتگرال اف(متر) را می توان با استفاده از تابع MS Excel BINOM.DIST محاسبه کرد. پنجره محاسبه مربوطه در زیر نشان داده شده است (برای بزرگنمایی کلیک چپ کنید).


MS Excel از شما می خواهد که داده های زیر را وارد کنید:

  • تعداد موفقیت ها؛
  • تعداد تست ها؛
  • احتمال موفقیت؛
  • انتگرال - مقدار منطقی: 0 - اگر نیاز به محاسبه احتمال دارید پ n ( متر) و 1 - در صورت احتمال اف(متر).

مثال 1.مدیر شرکت اطلاعات مربوط به تعداد دوربین های فروخته شده در 100 روز گذشته را خلاصه کرد. این جدول اطلاعات را خلاصه می کند و احتمال فروش تعداد معینی دوربین در روز را محاسبه می کند.

اگر 13 دوربین یا بیشتر فروخته شود روز با سود به پایان می رسد. احتمال اینکه روز سودآوری داشته باشد:

احتمال اینکه یک روز بدون سود کار شود:

اجازه دهید احتمال اینکه یک روز با سود کار می شود ثابت و برابر با 0.61 باشد و تعداد دوربین های فروخته شده در روز به روز بستگی ندارد. سپس می‌توانیم از توزیع دوجمله‌ای استفاده کنیم، جایی که رویداد آ- روز با سود کار خواهد شد، - بدون سود.

احتمال اینکه تمام 6 روز با سود کار شود:

.

ما همان نتیجه را با استفاده از تابع MS Excel BINOM.DIST بدست می آوریم (مقدار انتگرال 0 است):

پ 6 (6 ) = BINOM.DIST(6; 6; 0.61; 0) = 0.052.

احتمال اینکه از 6 روز 4 روز یا بیشتر با سود کار شود:

جایی که ,

,

با استفاده از تابع MS Excel BINOM.DIST، این احتمال را محاسبه می کنیم که از 6 روز بیش از 3 روز با سود کامل نمی شود (مقدار مقدار انتگرال 1 است):

پ 6 (≤3 ) = BINOM.DIST(3; 6; 0.61; 1) = 0.435.

احتمال اینکه تمام 6 روز با ضرر انجام شود:

,

می‌توانیم همان شاخص را با استفاده از تابع MS Excel BINOM.DIST محاسبه کنیم:

پ 6 (0 ) = BINOM.DIST(0; 6; 0.61; 0) = 0.0035.

خودتان مشکل را حل کنید و سپس راه حل را ببینید

مثال 2. 2 توپ سفید و 3 گلوله سیاه در کوزه وجود دارد. یک توپ از کوزه بیرون آورده می شود، رنگ آن تنظیم می شود و دوباره قرار می گیرد. تلاش 5 بار تکرار می شود. تعداد وقوع توپ های سفید یک متغیر تصادفی گسسته است ایکس، طبق قانون دوجمله ای توزیع می شود. قانون توزیع یک متغیر تصادفی را ترسیم کنید. حالت، انتظارات ریاضی و پراکندگی را تعریف کنید.

بیایید با هم به حل مشکلات ادامه دهیم

مثال 3.از پیک به سایت ها رفتیم n= 5 پیک. هر پیک محتمل است پ= 0.3، صرف نظر از دیگران، برای شیء دیر است. متغیر تصادفی گسسته ایکس- تعداد پیک های دیررس یک سری توزیع برای این متغیر تصادفی بسازید. انتظارات ریاضی، واریانس، انحراف معیار آن را بیابید. این احتمال را پیدا کنید که حداقل دو پیک برای اشیا تاخیر داشته باشند.

فصل 7.

قوانین خاص توزیع متغیرهای تصادفی

انواع قوانین توزیع متغیرهای تصادفی گسسته

اجازه دهید یک متغیر تصادفی گسسته مقادیر را بگیرد ایکس 1 , ایکس 2 , …, x n،…. احتمالات این مقادیر را می توان با استفاده از فرمول های مختلف محاسبه کرد، به عنوان مثال، با استفاده از قضایای اساسی نظریه احتمال، فرمول برنولی یا برخی فرمول های دیگر. برای برخی از این فرمول ها، قانون توزیع نام خاص خود را دارد.

رایج ترین قوانین توزیع یک متغیر تصادفی گسسته عبارتند از قانون توزیع دو جمله ای، هندسی، ابر هندسی و پواسون.

قانون توزیع دوجمله ای

بذار تولید بشه nمحاکمه های مستقل، که در هر کدام ممکن است رویداد ظاهر شود یا نباشد آ. احتمال وقوع این رویداد در هر آزمایش ثابت است، به عدد آزمایشی بستگی ندارد و برابر است با آر=آر(آ). از این رو احتمال رخ ندادن رویداد وجود دارد آدر هر آزمون نیز ثابت و مساوی است q=1–آر. متغیر تصادفی را در نظر بگیرید ایکسبرابر با تعداد وقوع رویداد است آ V nتست ها بدیهی است که مقادیر این کمیت برابر است

ایکس 1 = 0 - رویداد آ V nآزمایشات ظاهر نشد؛

ایکس 2 = 1 - رویداد آ V nیک بار در دادگاه ظاهر شد.

ایکس 3 = 2 - رویداد آ V nآزمایشات دو بار ظاهر شد.

…………………………………………………………..

x n +1 = n- رویداد آ V nهمه چیز در طول آزمایش ظاهر شد nیک بار.

احتمالات این مقادیر را می توان با استفاده از فرمول برنولی (4.1) محاسبه کرد:

جایی که به=0, 1, 2, …,n .

قانون توزیع دوجمله ای ایکسبرابر با تعداد موفقیت ها در nتست های برنولی با احتمال موفقیت آر.

بنابراین، یک متغیر تصادفی گسسته دارای توزیع دو جمله ای است (یا طبق قانون دو جمله ای توزیع می شود) اگر مقادیر ممکن آن 0، 1، 2، ...، n، و احتمالات مربوطه با استفاده از فرمول (7.1) محاسبه می شود.

توزیع دوجمله ای به دو عدد بستگی دارد مولفه های آرو n.

سری توزیع یک متغیر تصادفی که طبق قانون دوجمله ای توزیع شده است به شکل زیر است:

ایکس ک n
آر

مثال 7.1 . سه گلوله مستقل به سمت هدف شلیک می شود. احتمال زدن هر شلیک 0.4 است. مقدار تصادفی ایکس- تعداد ضربه به هدف سری توزیع آن را بسازید.

راه حل. مقادیر احتمالی یک متغیر تصادفی ایکسهستند ایکس 1 =0; ایکس 2 =1; ایکس 3 =2; ایکس 4 = 3. بیایید با استفاده از فرمول برنولی احتمالات مربوطه را پیدا کنیم. نشان دادن اینکه استفاده از این فرمول در اینجا کاملاً موجه است دشوار نیست. توجه داشته باشید که احتمال اصابت نکردن به هدف با یک شلیک برابر با 1-0.4=0.6 خواهد بود. ما گرفتیم

سری توزیع به شکل زیر است:

ایکس
آر 0,216 0,432 0,288 0,064

به راحتی می توان تأیید کرد که مجموع همه احتمالات برابر با 1 است. خود متغیر تصادفی ایکسطبق قانون دوجمله ای توزیع می شود. ■

بیایید انتظار ریاضی و واریانس یک متغیر تصادفی توزیع شده بر اساس قانون دو جمله ای را پیدا کنیم.

هنگام حل مثال 6.5 نشان داده شد که انتظار ریاضی از تعداد وقوع رویداد آ V nآزمایشات مستقل، در صورت احتمال وقوع آدر هر آزمون ثابت و مساوی است آر، برابر است n· آر

این مثال از یک متغیر تصادفی استفاده می کند که بر اساس قانون دو جمله ای توزیع شده است. بنابراین، حل مثال 6.5 اساساً اثبات قضیه زیر است.

قضیه 7.1.انتظار ریاضی از یک متغیر تصادفی گسسته توزیع شده بر اساس قانون دوجمله ای برابر است با حاصل ضرب تعداد آزمایش ها و احتمال "موفقیت"، یعنی. م(ایکس)=n· آر.

قضیه 7.2.واریانس یک متغیر تصادفی گسسته توزیع شده بر اساس قانون دوجمله ای برابر است با حاصل ضرب تعداد آزمایش بر اساس احتمال "موفقیت" و احتمال "شکست"، یعنی. D(ایکس)=nрq.

عدم تقارن و کشش یک متغیر تصادفی توزیع شده بر اساس قانون دوجمله ای توسط فرمول ها تعیین می شود.

این فرمول ها را می توان با استفاده از مفهوم گشتاورهای اولیه و مرکزی به دست آورد.

قانون توزیع دو جمله ای زیربنای بسیاری از موقعیت های زندگی واقعی است. برای مقادیر بزرگ nتوزیع دو جمله ای را می توان با استفاده از توزیع های دیگر، به ویژه توزیع پواسون، تقریب زد.

توزیع پواسون

بذار باشه nتست های برنولی، با تعداد تست ها nبه اندازه کافی بزرگ. قبلاً نشان داده شد که در این مورد (اگر، علاوه بر این، احتمال آرمناسبت ها آبسیار کوچک) برای یافتن احتمال وقوع رویداد آظاهر شدن تیپس از انجام آزمایشات، می توانید از فرمول پواسون (4.9) استفاده کنید. اگر متغیر تصادفی ایکسبه معنی تعداد وقوع رویداد است آ V nبرنولی آزمایش می کند، سپس احتمال آن ایکسارزش را خواهد گرفت کبا استفاده از فرمول قابل محاسبه است

, (7.2)

جایی که λ = .

قانون توزیع پواسونتوزیع یک متغیر تصادفی گسسته نامیده می شود ایکس، که مقادیر ممکن برای آن اعداد صحیح غیر منفی و احتمالات هستند r tاین مقادیر با استفاده از فرمول (7.2) یافت می شوند.

اندازه λ = تماس گرفت پارامترتوزیع پواسون

یک متغیر تصادفی که بر اساس قانون پواسون توزیع می‌شود، می‌تواند تعداد نامتناهی مقدار بگیرد. از آنجایی که برای این توزیع احتمال آروقوع یک رویداد در هر آزمایش کم است، سپس این توزیع گاهی اوقات قانون رویدادهای نادر نامیده می شود.

سری توزیع یک متغیر تصادفی که بر اساس قانون پواسون توزیع شده است دارای شکل است

ایکس تی
آر

به راحتی می توان تأیید کرد که مجموع احتمالات ردیف دوم برابر با 1 است. برای انجام این کار، باید به خاطر داشته باشید که تابع را می توان به یک سری Maclaurin گسترش داد، که برای هر یک از آنها همگرا می شود. ایکس. در این مورد داریم

. (7.3)

همانطور که اشاره شد، قانون پواسون در موارد محدود کننده خاصی جایگزین قانون دوجمله ای می شود. یک مثال متغیر تصادفی است ایکسکه مقادیر آن برابر با تعداد خرابی ها در یک دوره زمانی معین در استفاده مکرر از یک دستگاه فنی است. فرض بر این است که این یک دستگاه بسیار قابل اعتماد است، به عنوان مثال. احتمال شکست در یک برنامه بسیار کم است.

علاوه بر این موارد محدود کننده، در عمل متغیرهای تصادفی بر اساس قانون پواسون توزیع شده‌اند که با توزیع دوجمله‌ای مرتبط نیستند. به عنوان مثال، توزیع پواسون اغلب برای برخورد با تعداد رویدادهایی که در یک بازه زمانی رخ می‌دهند (تعداد تماس‌های دریافتی در یک مرکز تلفن در طول یک ساعت، تعداد اتومبیل‌هایی که در طول یک روز به یک کارواش می‌رسند، تعداد توقف های ماشین در هفته و غیره .). همه این رویدادها باید به اصطلاح جریان رویدادها را تشکیل دهند که یکی از مفاهیم اساسی تئوری صف است. پارامتر λ میانگین شدت جریان رویدادها را مشخص می کند.

مثال 7.2 . 500 دانشجو در این دانشکده وجود دارد. احتمال اینکه اول شهریور روز تولد سه دانش آموز این دپارتمان باشد چقدر است؟

راه حل . از آنجایی که تعداد دانش آموزان n=500 بسیار بزرگ است و آر– احتمال تولد اول شهریور برای هر یک از دانش آموزان برابر است، یعنی. به اندازه کافی کوچک است، پس می توانیم فرض کنیم که متغیر تصادفی است ایکس- تعداد دانش آموزان متولد 1 سپتامبر طبق قانون پواسون با پارامتر توزیع می شود λ = n.p.= 1.36986. سپس طبق فرمول (7.2) بدست می آوریم

قضیه 7.3.اجازه دهید متغیر تصادفی ایکسطبق قانون پواسون توزیع می شود. سپس انتظار و واریانس ریاضی آن با یکدیگر برابر و برابر با مقدار پارامتر است λ ، یعنی م(ایکس) = D(ایکس) = λ = n.p..

اثباتبا تعریف انتظار ریاضی، با استفاده از فرمول (7.3) و سری توزیع یک متغیر تصادفی که طبق قانون پواسون توزیع شده است، به دست می آوریم.

قبل از یافتن واریانس، ابتدا انتظار ریاضی مجذور متغیر تصادفی مورد بررسی را پیدا می کنیم. ما گرفتیم

از اینجا، با تعریف پراکندگی، دریافت می کنیم

قضیه ثابت شده است.

با استفاده از مفاهیم گشتاورهای اولیه و مرکزی می توان نشان داد که برای متغیر تصادفی توزیع شده بر اساس قانون پواسون، ضرایب چولگی و کشیدگی با فرمول ها تعیین می شوند.

درک آن دشوار نیست، زیرا محتوای معنایی پارامتر است λ = n.p.مثبت است، سپس یک متغیر تصادفی توزیع شده بر اساس قانون پواسون همیشه دارای چولگی و کشیدگی مثبت است.

- (توزیع دوجمله ای) توزیعی که به شما امکان می دهد احتمال وقوع هر رویداد تصادفی را که در نتیجه مشاهدات تعدادی رویداد مستقل به دست می آید محاسبه کنید، در صورتی که احتمال وقوع اجزای اولیه آن ... ... فرهنگ لغت اقتصادی

- (توزیع برنولی) توزیع احتمال تعداد وقوع یک رویداد خاص در طول آزمایشات مستقل مکرر، در صورتی که احتمال وقوع این رویداد در هر آزمایش برابر با p(0 p 1) باشد. دقیقا عدد؟ اتفاقات این رویداد عبارتند از ...... فرهنگ لغت دایره المعارفی بزرگ

توزیع دو جمله ای- - مباحث مخابرات، مفاهیم اولیه توزیع دو جمله ای EN ...

- (توزیع برنولی)، توزیع احتمال تعداد وقوع یک رویداد خاص در طول آزمایشات مستقل مکرر، در صورتی که احتمال وقوع این رویداد در هر آزمایش برابر با p (0≤p≤1) باشد. یعنی تعداد μ وقوع این رویداد... ... فرهنگ لغت دایره المعارفی

توزیع دو جمله ای- 1.49. توزیع دو جمله ای توزیع احتمال یک متغیر تصادفی گسسته X، با گرفتن هر مقدار صحیح از 0 تا n، به طوری که برای x = 0، 1، 2، ...، n و پارامترهای n = 1، 2، ... و 0< p < 1, где Источник … فرهنگ لغت - کتاب مرجع شرایط اسناد هنجاری و فنی

توزیع برنولی، توزیع احتمال یک متغیر تصادفی X، با گرفتن مقادیر صحیح با احتمالات، به ترتیب (ضریب دوجمله ای؛ پارامتر p از B.r.، به نام احتمال یک نتیجه مثبت، با گرفتن مقادیر ... دایره المعارف ریاضی

توزیع احتمال تعداد وقوع یک رویداد خاص در طول آزمایش‌های مستقل مکرر. اگر در طول هر آزمایش احتمال وقوع یک رویداد برابر با p باشد، با 0 ≤ p ≤ 1، آنگاه تعداد μ وقوع این رویداد برای n مستقل... ... بزرگ دایره المعارف شوروی

- (توزیع برنولی)، توزیع احتمال تعداد وقوع یک رویداد خاص در طول آزمایشات مستقل مکرر، در صورتی که احتمال وقوع این رویداد در هر آزمایش برابر با p باشد (0).<или = p < или = 1). Именно, число м появлений … علوم طبیعی. فرهنگ لغت دایره المعارفی

توزیع احتمال دو جمله ای- (توزیع دو جمله ای) توزیعی که در مواردی مشاهده می شود که نتیجه هر آزمایش مستقل (مشاهده آماری) یکی از دو مقدار ممکن را بگیرد: پیروزی یا شکست، شمول یا طرد، به علاوه یا ... فرهنگ لغت اقتصادی و ریاضی

توزیع احتمال دو جمله ای- توزیعی که در مواردی مشاهده می شود که نتیجه هر آزمایش مستقل (مشاهده آماری) یکی از دو مقدار ممکن را بگیرد: پیروزی یا شکست، شمول یا حذف، مثبت یا منفی، 0 یا 1. یعنی... ... راهنمای مترجم فنی

کتاب ها

  • نظریه احتمالات و آمار ریاضی در مسائل. بیش از 360 مسئله و تمرین، D. A. Borzykh. کتابچه راهنمای پیشنهادی شامل وظایفی با سطوح مختلف پیچیدگی است. با این حال، تأکید اصلی بر وظایف با پیچیدگی متوسط ​​است. این کار عمداً برای تشویق دانش آموزان به ...
  • تئوری احتمالات و آمار ریاضی در مسائل بیش از 360 مسئله و تمرین، د. برزیخ کتابچه راهنمای پیشنهادی شامل مسائلی با سطوح مختلف پیچیدگی است. با این حال، تأکید اصلی بر وظایف با پیچیدگی متوسط ​​است. این کار عمداً برای تشویق دانش آموزان به ...