Streszczenia Oświadczenia Historia

Rozkład dwumianowy dyskretnej zmiennej losowej. Rozkład dwumianowy Funkcja generująca rozkład dwumianowy

W tym i kilku następnych postach przyjrzymy się matematycznym modelom zdarzeń losowych. Model matematyczny jest wyrażeniem matematycznym reprezentującym zmienną losową. W przypadku dyskretnych zmiennych losowych to wyrażenie matematyczne jest znane jako funkcja rozkładu.

Jeśli zadanie pozwala na jawne napisanie wyrażenia matematycznego reprezentującego zmienną losową, możesz obliczyć dokładne prawdopodobieństwo dowolnej jej wartości. W takim przypadku możesz obliczyć i wyświetlić wszystkie wartości funkcji rozkładu. W zastosowaniach biznesowych, socjologicznych i medycznych spotyka się różnorodne rozkłady zmiennych losowych. Jednym z najbardziej przydatnych rozkładów jest rozkład dwumianowy.

Rozkład dwumianowy służy do symulacji sytuacji charakteryzujących się następującymi cechami.

  • Próbka składa się ze stałej liczby elementów N, reprezentujące wyniki określonego testu.
  • Każdy element próbki należy do jednej z dwóch wzajemnie wykluczających się kategorii, które wyczerpują całą przestrzeń próbek. Zazwyczaj te dwie kategorie nazywane są sukcesem i porażką.
  • Prawdopodobieństwo sukcesu R jest stała. Dlatego prawdopodobieństwo niepowodzenia wynosi 1 – str.
  • Wynik (tj. sukces lub porażka) jakiegokolwiek badania nie zależy od wyniku innego badania. Aby zapewnić niezależność wyników, elementy próbki uzyskuje się zwykle dwiema różnymi metodami. Każdy przykładowy element jest losowo pobierany z nieskończoności populacja bez powrotu lub ze skończonej populacji z powrotem.

Pobierz notatkę w formacie lub, przykłady w formacie

Rozkład dwumianowy służy do oszacowania liczby sukcesów w próbie składającej się z N obserwacje. Weźmy na przykład zamawianie. W celu złożenia zamówienia klienci firmy Saxon Company mogą skorzystać z interaktywnego formularza elektronicznego i przesłać go do firmy. System informatyczny sprawdza wówczas, czy w zamówieniach nie występują błędy, niekompletne lub błędne informacje. Każde przedmiotowe zamówienie jest oznaczane i uwzględniane w dziennym raporcie wyjątków. Dane zebrane przez firmę wskazują, że prawdopodobieństwo błędów w zamówieniach wynosi 0,1. Firma chciałaby wiedzieć, jakie jest prawdopodobieństwo znalezienia w danej próbie określonej liczby błędnych zamówień. Załóżmy na przykład, że klienci ukończyli cztery formularze elektroniczne. Jakie jest prawdopodobieństwo, że wszystkie zamówienia będą wolne od błędów? Jak obliczyć to prawdopodobieństwo? Przez sukces rozumiemy błąd podczas wypełniania formularza, a wszystkie inne wyniki będą traktowane jako niepowodzenie. Przypomnijmy, że interesuje nas liczba błędnych zleceń w danej próbie.

Jakie efekty możemy zaobserwować? Jeśli próba składa się z czterech rzędów, jeden, dwa, trzy lub wszystkie cztery mogą być nieprawidłowe i wszystkie mogą być prawidłowe. Czy zmienna losowa opisująca liczbę błędnie wypełnionych formularzy może przyjąć inną wartość? Nie jest to możliwe, gdyż liczba formularzy błędnych nie może przekraczać liczebności próby N lub być negatywny. Zatem zmienna losowa zgodna z prawem rozkładu dwumianowego przyjmuje wartości od 0 do N.

Załóżmy, że w próbie czterech rzędów zaobserwowano następujące wyniki:

Jakie jest prawdopodobieństwo znalezienia trzech błędnych zamówień w próbie czterech zamówień, w określonej kolejności? Ponieważ wstępne badania wykazały, że prawdopodobieństwo błędu przy wypełnianiu formularza wynosi 0,10, prawdopodobieństwa powyższych wyników oblicza się w następujący sposób:

Ponieważ wyniki nie są od siebie zależne, prawdopodobieństwo wystąpienia określonej sekwencji wyników wynosi: p*p*(1–p)*p = 0,1*0,1*0,9*0,1 = 0,0009. Jeśli chcesz obliczyć liczbę wyborów X N elementów, należy skorzystać ze wzoru na kombinację (1):

gdzie n! = n * (n –1) * (n – 2) * … * 2 * 1 - silnia liczby N i 0! = 1 i 1! = 1 z definicji.

Wyrażenie to jest często określane jako . Zatem, jeśli n = 4 i X = 3, liczbę sekwencji składających się z trzech elementów wyodrębnionych z próby o wielkości 4 określa się za pomocą następującego wzoru:

Dlatego prawdopodobieństwo wykrycia trzech błędnych zleceń oblicza się w następujący sposób:

(Liczba możliwych sekwencji) *
(prawdopodobieństwo określonej sekwencji) = 4 * 0,0009 = 0,0036

Podobnie możesz obliczyć prawdopodobieństwo, że wśród czterech zamówień będzie jedno lub dwa błędne, a także prawdopodobieństwo, że wszystkie zamówienia są błędne lub wszystkie są prawidłowe. Jednakże wraz ze wzrostem wielkości próby N określenie prawdopodobieństwa określonej sekwencji wyników staje się trudniejsze. W takim przypadku należy zastosować odpowiedni model matematyczny opisujący dwumianowy rozkład liczby wyborów X obiekty z zaznaczenia zawierającego N elementy.

Rozkład dwumianowy

Gdzie P(X)- prawdopodobieństwo X sukces dla danej wielkości próby N i prawdopodobieństwo sukcesu R, X = 0, 1, … N.

Należy pamiętać, że wzór (2) jest formalizacją intuicyjnych wniosków. Zmienna losowa X, który przestrzega rozkładu dwumianowego, może przyjmować dowolną wartość całkowitą z zakresu od 0 do N. Praca RX(1 – p)NX reprezentuje prawdopodobieństwo określonej sekwencji składającej się z X sukces w próbie o wielkości równej N. Wartość określa liczbę możliwych kombinacji składających się z X sukces w N testy. Zatem dla danej liczby testów N i prawdopodobieństwo sukcesu R prawdopodobieństwo ciągu składającego się z X sukces, równy

P(X) = (liczba możliwych ciągów) * (prawdopodobieństwo konkretnego ciągu) =

Rozważmy przykłady ilustrujące zastosowanie wzoru (2).

1. Załóżmy, że prawdopodobieństwo błędnego wypełnienia formularza wynosi 0,1. Jakie jest prawdopodobieństwo, że spośród czterech wypełnionych formularzy trzy będą błędne? Korzystając ze wzoru (2) stwierdzamy, że prawdopodobieństwo wykrycia trzech błędnych rzędów w próbie składającej się z czterech rzędów jest równe

2. Załóżmy, że prawdopodobieństwo błędnego wypełnienia formularza wynosi 0,1. Jakie jest prawdopodobieństwo, że spośród czterech wypełnionych formularzy co najmniej trzy będą błędne? Jak pokazano w poprzednim przykładzie, prawdopodobieństwo, że spośród czterech wypełnionych formularzy trzy będą nieprawidłowe, wynosi 0,0036. Aby obliczyć prawdopodobieństwo, że spośród czterech wypełnionych formularzy co najmniej trzy będą błędne, należy dodać prawdopodobieństwo, że spośród czterech wypełnionych formularzy trzy będą błędne oraz prawdopodobieństwo, że spośród czterech wypełnionych formularzy wszystkie będą błędne. Prawdopodobieństwo drugiego zdarzenia wynosi

Zatem prawdopodobieństwo, że spośród czterech wypełnionych formularzy co najmniej trzy będą nieprawidłowe, jest równe

P(X > 3) = P(X = 3) + P(X = 4) = 0,0036 + 0,0001 = 0,0037

3. Załóżmy, że prawdopodobieństwo błędnego wypełnienia formularza wynosi 0,1. Jakie jest prawdopodobieństwo, że z czterech wypełnionych formularzy mniej niż trzy będą błędne? Prawdopodobieństwo tego zdarzenia

P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

Korzystając ze wzoru (2), obliczamy każde z tych prawdopodobieństw:

Dlatego P(X< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Prawdopodobieństwo P(X< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. Następnie P(X< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

W miarę zwiększania się wielkości próbki N obliczenia podobne do tych przeprowadzonych w przykładzie 3 stają się trudne. Aby uniknąć tych komplikacji, wiele prawdopodobieństw dwumianowych jest zestawionych z wyprzedzeniem. Niektóre z tych prawdopodobieństw pokazano na ryc. 1. Na przykład, aby uzyskać prawdopodobieństwo, że X= 2 godz N= 4 i P= 0,1, należy wyodrębnić z tabeli liczbę na przecięciu prostej X= 2 i kolumny R = 0,1.

Ryż. 1. Prawdopodobieństwo dwumianowe w N = 4, X= 2 i R = 0,1

Rozkład dwumianowy można obliczyć za pomocą funkcji Excela = ROZKŁ.BINOM() (rys. 2), która ma 4 parametry: liczba sukcesów - X, liczba testów (lub wielkość próby) – N, prawdopodobieństwo sukcesu – R, parametr całka, która przyjmuje wartość TRUE (w tym przypadku obliczane jest prawdopodobieństwo nie mniej X zdarzenia) lub FAŁSZ (w tym przypadku obliczane jest prawdopodobieństwo Dokładnie X wydarzenia).

Ryż. 2. Parametry funkcji = ROZKŁ.BINOM()

Dla powyższych trzech przykładów obliczenia pokazano na ryc. 3 (patrz także plik Excel). Każda kolumna zawiera jedną formułę. Liczby pokazują odpowiedzi na przykłady odpowiadającej liczbie).

Ryż. 3. Obliczanie rozkładu dwumianowego w programie Excel dla N= 4 i P = 0,1

Własności rozkładu dwumianowego

Rozkład dwumianowy zależy od parametrów N I R. Rozkład dwumianowy może być symetryczny lub asymetryczny. Jeżeli p = 0,05, rozkład dwumianowy jest symetryczny niezależnie od wartości parametru N. Jeśli jednak p ≠ 0,05, rozkład staje się skośny. Im bliższa jest wartość parametru R do 0,05 i im większy jest rozmiar próbki N, tym mniej wyraźna jest asymetria rozkładu. Zatem rozkład liczby błędnie wypełnionych formularzy jest przesunięty w prawo, ponieważ P= 0,1 (ryc. 4).

Ryż. 4. Histogram rozkładu dwumianowego przy N= 4 i P = 0,1

Oczekiwanie rozkładu dwumianowego równy iloczynowi wielkości próbki N na prawdopodobieństwo sukcesu R:

(3) M = E(X) =n.p.

Średnio przy odpowiednio długiej serii badań w próbie składającej się z czterech rzędów może pojawić się p = E(X) = 4 x 0,1 = 0,4 formularzy błędnie wypełnionych.

Odchylenie standardowe rozkładu dwumianowego

Na przykład odchylenie standardowe liczby błędnie wypełnionych formularzy w księgowości systemu informacyjnego równa się:

Wykorzystano materiały z książki Levin i in. Statystyka dla menedżerów. – M.: Williams, 2004. – s. 25 307–313

Nie wszystkie zjawiska mierzy się w skali ilościowej takiej jak 1, 2, 3... 100500... Zjawisko nie zawsze może przybierać nieskończoną lub dużą liczbę różnych stanów. Na przykład płeć osoby może być M lub F. Strzelec albo trafia w cel, albo chybia. Można głosować „za” lub „przeciw” itp. itp. Innymi słowy, takie dane odzwierciedlają stan alternatywnego atrybutu – albo „tak” (zdarzenie miało miejsce), albo „nie” (zdarzenie nie miało miejsca). Występujące wydarzenie (pozytywny wynik) nazywane jest także „sukcesem”.

Eksperymenty z takimi danymi nazywane są Schemat Bernoulliego, na cześć słynnego szwajcarskiego matematyka, który ustalił, że kiedy duże ilości testów, stosunek wyników pozytywnych do całkowitej liczby testów zmierza do prawdopodobieństwa wystąpienia tego zdarzenia.

Alternatywna zmienna charakterystyczna

Aby móc zastosować w analizie aparaturę matematyczną, wyniki takich obserwacji należy zapisać w postać liczbowa. W tym celu wynikowi dodatniemu przypisuje się cyfrę 1, wynikowi ujemnemu – 0. Inaczej mówiąc, mamy do czynienia ze zmienną, która może przyjmować tylko dwie wartości: 0 lub 1.

Jakie korzyści można z tego wyciągnąć? Właściwie nie mniej niż ze zwykłych danych. Łatwo zatem policzyć liczbę pozytywnych wyników – wystarczy zsumować wszystkie wartości, tj. wszystkie 1 (sukces). Można pójść dalej, ale będzie to wymagało wprowadzenia kilku oznaczeń.

Pierwszą rzeczą, na którą należy zwrócić uwagę, jest to, że pozytywne wyniki (które są równe 1) mają pewne prawdopodobieństwo wystąpienia. Na przykład orzeł podczas rzucania monetą wynosi ½ lub 0,5. Prawdopodobieństwo to jest tradycyjnie oznaczane literą łacińską P. Zatem prawdopodobieństwo wystąpienia zdarzenia alternatywnego jest równe 1 - str, co jest również oznaczone Q, to jest q = 1 – p. Zapisy te można wyraźnie usystematyzować w postaci tablicy rozkładu zmiennych X.

Otrzymaliśmy listę możliwych wartości i ich prawdopodobieństw. Można obliczyć oczekiwanie matematyczne I dyspersja. Oczekiwanie jest sumą iloczynów wszystkich możliwych wartości i odpowiadających im prawdopodobieństw:

Obliczmy oczekiwanie, korzystając z zapisów w powyższych tabelach.

Okazuje się, że matematyczne oczekiwanie znaku alternatywnego jest równe prawdopodobieństwu tego zdarzenia - P.

Zdefiniujmy teraz, jaka jest wariancja alternatywnego atrybutu. Dyspersja to średni kwadrat odchyleń od oczekiwań matematycznych. Ogólna formuła(dla danych dyskretnych) ma postać:

Stąd wariancja alternatywnego atrybutu:

Łatwo zauważyć, że ta dyspersja ma maksymalnie 0,25 (przy p=0,5).

Odchylenie standardowe jest pierwiastkiem wariancji:

Maksymalna wartość nie przekracza 0,5.

Jak widać, zarówno oczekiwanie matematyczne, jak i wariancja alternatywnego atrybutu mają bardzo zwartą postać.

Rozkład dwumianowy zmiennej losowej

Spójrzmy na sytuację z innej perspektywy. Rzeczywiście, kogo obchodzi, że średnia strata orłów na rzut wynosi 0,5? Nie sposób sobie tego nawet wyobrazić. Bardziej interesujące jest zadanie pytania o liczbę reszek przypadających na daną liczbę rzutów.

Innymi słowy, badacza często interesuje prawdopodobieństwo wystąpienia określonej liczby pomyślnych zdarzeń. Może to być liczba wadliwych produktów w badanej partii (1 – wadliwe, 0 – dobre) lub liczba wyzdrowień (1 – zdrowe, 0 – chore) itp. Liczba takich „sukcesów” będzie równa sumie wszystkich wartości zmiennej X, tj. liczba pojedynczych wyników.

Zmienna losowa B nazywa się dwumianem i przyjmuje wartości od 0 do N(Na B= 0 – wszystkie części są odpowiednie, przy czym B = N– wszystkie części są uszkodzone). Zakłada się, że wszystkie wartości X niezależne od siebie. Rozważmy główne cechy zmiennej dwumianowej, to znaczy ustalimy jej matematyczne oczekiwanie, rozproszenie i rozkład.

Oczekiwanie na zmienną dwumianową jest bardzo łatwe do uzyskania. Matematyczne oczekiwanie sumy wielkości jest sumą matematycznych oczekiwań każdej dodanej wielkości i jest takie samo dla wszystkich, dlatego:

Na przykład matematyczne oczekiwanie liczby orłów wyrzuconych w 100 rzutach wynosi 100 × 0,5 = 50.

Teraz wyprowadzamy wzór na rozproszenie zmiennej dwumianowej. Wariancja sumy niezależnych zmiennych losowych jest sumą wariancji. Stąd

Odpowiednio odchylenie standardowe

Dla 100 rzutów monetą odchylenie standardowe liczby orłów wynosi

Na koniec rozważ rozkład wartości dwumianowej, tj. prawdopodobieństwo, że zmienna losowa B przyjmą różne wartości k, Gdzie 0≤k≤n. W przypadku monety problem ten może wyglądać następująco: Jakie jest prawdopodobieństwo, że w 100 rzutach wypadnie 40 orłów?

Aby zrozumieć metodę obliczeń, wyobraź sobie, że monetą rzuca się tylko 4 razy. Za każdym razem każda ze stron może wypaść. Zadajemy sobie pytanie: jakie jest prawdopodobieństwo, że w 4 rzutach wyrzucimy 2 reszki. Każdy rzut jest od siebie niezależny. Oznacza to, że prawdopodobieństwo uzyskania dowolnej kombinacji będzie równe iloczynowi prawdopodobieństw danego wyniku dla każdego pojedynczego rzutu. Niech O będzie reszką, P reszką. Wtedy np. jedna z kombinacji, która nam odpowiada, może wyglądać jak OOPP, czyli:

Prawdopodobieństwo takiej kombinacji jest równe iloczynowi dwóch prawdopodobieństw wyrzucenia orła i dwóch kolejnych prawdopodobieństw, że nie wypadnie orzeł (zdarzenie odwrotne, obliczane jako 1 - str), tj. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Jest to prawdopodobieństwo jednej z kombinacji, która nam odpowiada. Ale pytanie dotyczyło całkowitej liczby orłów, a nie niektórych w określonej kolejności. Następnie musisz dodać prawdopodobieństwa wszystkich kombinacji, w których są dokładnie 2 orły. Oczywiście wszystkie są takie same (produkt nie zmienia się pod wpływem zmiany czynników). Dlatego należy obliczyć ich liczbę, a następnie pomnożyć przez prawdopodobieństwo wystąpienia takiej kombinacji. Policzmy wszystkie kombinacje 4 rzutów 2 orłami: RROO, RORO, ROOR, ORRO, OROR, OORR. W sumie jest 6 opcji.

Zatem pożądane prawdopodobieństwo zdobycia 2 orłów po 4 rzutach wynosi 6×0,0625=0,375.

Jednak liczenie w ten sposób jest nudne. Już za 10 monet bardzo trudno będzie uzyskać całkowitą liczbę opcji metodą brutalnej siły. Dlatego mądrzy ludzie już dawno wymyślili wzór, za pomocą którego obliczają liczbę różnych kombinacji N elementy wg k, Gdzie N– całkowita liczba elementów, k– liczba elementów, z których obliczane są możliwości aranżacji. Kombinacja formuł N elementy wg k czy to:

Podobne rzeczy dzieją się w sekcji kombinatoryki. Wysyłam tam każdego, kto chce udoskonalić swoją wiedzę. Stąd swoją drogą nazwa rozkładu dwumianowego (powyższy wzór jest współczynnikiem rozwinięcia dwumianu Newtona).

Wzór na określenie prawdopodobieństwa można łatwo uogólnić na dowolną wielkość N I k. W rezultacie wzór na rozkład dwumianowy ma następującą postać.

Liczba kombinacji spełniających ten warunek jest mnożona przez prawdopodobieństwo wystąpienia jednej z nich.

Do praktycznego zastosowania wystarczy znać wzór na rozkład dwumianowy. A może nawet nie wiesz – poniżej pokazujemy, jak określić prawdopodobieństwo za pomocą Excela. Ale lepiej wiedzieć.

Korzystając z tego wzoru, obliczamy prawdopodobieństwo zdobycia 40 reszek w 100 rzutach:

Albo tylko 1,08%. Dla porównania prawdopodobieństwo matematycznego oczekiwania tego eksperymentu, czyli 50 reszek, wynosi 7,96%. Maksymalne prawdopodobieństwo wartości dwumianowej należy do wartości odpowiadającej oczekiwaniu matematycznemu.

Obliczanie prawdopodobieństwa rozkładu dwumianowego w programie Excel

Jeśli używasz tylko papieru i kalkulatora, obliczenia przy użyciu wzoru na rozkład dwumianowy, pomimo braku całek, są dość trudne. Na przykład wartość wynosi 100! – ma więcej niż 150 znaków. Wcześniej, a nawet teraz, do obliczania takich wielkości używano wzorów przybliżonych. W tej chwili wskazane jest korzystanie ze specjalnego oprogramowania, takiego jak MS Excel. Zatem każdy użytkownik (nawet humanista z wykształcenia) może łatwo obliczyć prawdopodobieństwo wartości o rozkładzie dwumianowym zmienna losowa.

Do utrwalenia materiału będziemy na razie używać Excela jako zwykłego kalkulatora, czyli tzw. Przeprowadźmy obliczenia krok po kroku, korzystając ze wzoru na rozkład dwumianowy. Obliczmy na przykład prawdopodobieństwo zdobycia 50 reszek. Poniżej znajduje się zdjęcie z krokami obliczeń i wynikiem końcowym.

Jak widać, wyniki pośrednie są takiej skali, że nie mieszczą się w komórce, mimo że są stosowane wszędzie proste funkcje typy: CZYNNIK (obliczanie silni), MOC (podnoszenie liczby do potęgi), a także operatory mnożenia i dzielenia. Co więcej, obliczenia te są dość kłopotliwe; w każdym razie nie są zwarte, ponieważ zaangażowanych jest wiele komórek. Tak, i trochę trudno jest to od razu ustalić.

Ogólnie rzecz biorąc, Excel udostępnia gotową funkcję do obliczania prawdopodobieństw rozkładu dwumianowego. Funkcja nazywa się ROZKŁAD BINOM.

Liczba sukcesów – liczba pomyślnych testów. Mamy ich 50.

Liczba testów – ilość rzutów: 100 razy.

Prawdopodobieństwo sukcesu – prawdopodobieństwo wyrzucenia orła w jednym rzucie wynosi 0,5.

Całka – wskazuje się 1 lub 0. Jeżeli 0, to obliczane jest prawdopodobieństwo P(B=k); jeśli 1, to zostanie obliczona funkcja rozkładu dwumianowego, tj. suma wszystkich prawdopodobieństw od B=0 Do B=k włącznie.

Kliknij OK i uzyskaj taki sam wynik jak powyżej, tylko że wszystko zostało obliczone przez jedną funkcję.

Bardzo wygodne. Dla eksperymentu zamiast ostatniego parametru 0 wstawiliśmy 1. Otrzymujemy 0,5398. Oznacza to, że przy 100 rzutach monetą prawdopodobieństwo wyrzucenia reszki od 0 do 50 wynosi prawie 54%. Ale na początku wydawało się, że powinno być 50%. Ogólnie rzecz biorąc, obliczenia są wykonywane szybko i łatwo.

Prawdziwy analityk musi zrozumieć, jak zachowuje się funkcja (jaki jest jej rozkład), dlatego obliczymy prawdopodobieństwa dla wszystkich wartości od 0 do 100. Czyli zadamy pytanie: jakie jest prawdopodobieństwo, że ani jeden orzeł pojawi się, że pojawi się 1 orzeł, 2, 3, 50, 90 lub 100. Obliczenie pokazano na poniższym obrazku. Niebieska linia to sam rozkład dwumianowy, czerwona kropka to prawdopodobieństwo określonej liczby sukcesów k.

Ktoś mógłby zapytać, czy rozkład dwumianowy jest podobny do… Tak, bardzo podobny. Nawet Moivre (w 1733 r.) mówił, że przy dużych próbach zbliża się rozkład dwumianowy (nie wiem, jak to się wtedy nazywało), ale nikt go nie słuchał. Dopiero Gauss, a następnie Laplace 60-70 lat później zostali ponownie odkryci i dokładnie zbadani normalne prawo dystrybucje. Powyższy wykres wyraźnie pokazuje, że maksymalne prawdopodobieństwo mieści się w oczekiwaniu matematycznym, a w miarę odchyleń od niego gwałtownie maleje. Podobnie jak normalne prawo.

Rozkład dwumianowy ma ogromne znaczenie praktyczne i występuje dość często. Dzięki Excelowi obliczenia są wykonywane szybko i łatwo.

Rozkład dwumianowy jest jednym z najważniejszych rozkładów prawdopodobieństwa dyskretnie zmieniającej się zmiennej losowej. Rozkład dwumianowy to rozkład prawdopodobieństwa liczby M wystąpienie zdarzenia A V N wzajemnie niezależne obserwacje. Często wydarzenie A nazywa się „sukcesem” obserwacji, a zdarzenie odwrotne nazywa się „porażką”, ale określenie to jest bardzo warunkowe.

Warunki rozkładu dwumianowego:

  • w sumie zrealizowane N próby, w których zdarzenie A może, ale nie musi wystąpić;
  • wydarzenie A w każdej próbie może wystąpić z tym samym prawdopodobieństwem P;
  • testy są od siebie niezależne.

Prawdopodobieństwo, że w N wydarzenie testowe A przyjdzie dokładnie M razy można obliczyć za pomocą wzoru Bernoulliego:

Gdzie P- prawdopodobieństwo wystąpienia zdarzenia A;

Q = 1 - P- prawdopodobieństwo wystąpienia zdarzenia odwrotnego.

Rozwiążmy to dlaczego rozkład dwumianowy jest powiązany ze wzorem Bernoulliego w sposób opisany powyżej? . Zdarzenie - liczba sukcesów w N testy podzielone są na kilka opcji, w każdej z nich osiągany jest sukces M testy i awarie - w N - M testy. Rozważmy jedną z tych opcji - B1 . Korzystając z reguły dodawania prawdopodobieństw, mnożymy prawdopodobieństwa przeciwnych zdarzeń:

,

i jeśli oznaczymy Q = 1 - P, To

.

Każda inna opcja, w której M sukces i N - M niepowodzenia. Liczba takich opcji jest równa liczbie sposobów, na jakie można to zrobić N przetestuj M sukces.

Suma wszystkich prawdopodobieństw M numery wystąpień zdarzeń A(cyfry od 0 do N) jest równe jeden:

gdzie każdy termin reprezentuje termin w dwumianie Newtona. Dlatego rozważany rozkład nazywa się rozkładem dwumianowym.

W praktyce często konieczne jest obliczenie prawdopodobieństw „nie więcej niż M sukces w N testy” lub „przynajmniej M sukces w N testy”. Stosowane są w tym celu następujące wzory.

Funkcja całkowa, tj prawdopodobieństwo F(M) co jest w środku N wydarzenie obserwacyjne A więcej nie nadejdzie M raz, można obliczyć korzystając ze wzoru:

Z kolei prawdopodobieństwo F(≥M) co jest w środku N wydarzenie obserwacyjne A przyjdzie nie mniej M raz, oblicza się według wzoru:

Czasami wygodniej jest obliczyć prawdopodobieństwo, że N wydarzenie obserwacyjne A więcej nie nadejdzie M razy, poprzez prawdopodobieństwo zdarzenia odwrotnego:

.

Wybór wzoru zależy od tego, który z nich ma sumę zawierającą mniej wyrazów.

Charakterystykę rozkładu dwumianowego oblicza się za pomocą poniższych wzorów .

Oczekiwanie matematyczne: .

Dyspersja: .

Odchylenie standardowe: .

Rozkład dwumianowy i obliczenia w programie MS Excel

Prawdopodobieństwo dwumianowe P N ( M) i wartości funkcji całkowej F(M) można obliczyć za pomocą funkcji MS Excel ROZKŁ.BINOM. Okno odpowiednich obliczeń pokazano poniżej (kliknij lewym przyciskiem myszy, aby powiększyć).


MS Excel wymaga wprowadzenia następujących danych:

  • liczba sukcesów;
  • liczba testów;
  • prawdopodobieństwo sukcesu;
  • całka - wartość logiczna: 0 - jeśli chcesz obliczyć prawdopodobieństwo P N ( M) i 1 - jeśli prawdopodobieństwo F(M).

Przykład 1. Menedżer firmy podsumował informacje o liczbie sprzedanych kamer w ciągu ostatnich 100 dni. Tabela podsumowuje informacje i oblicza prawdopodobieństwo, że dziennie będzie sprzedawana określona liczba kamer.

Dzień kończy się zyskiem, jeśli sprzedanych zostanie 13 lub więcej kamer. Prawdopodobieństwo, że dzień będzie pomyślnie przepracowany:

Prawdopodobieństwo, że dzień zostanie przepracowany bez zysku:

Niech prawdopodobieństwo, że dzień przepracuje się z zyskiem, będzie stałe i równe 0,61, a liczba sprzedawanych dziennie kamer nie zależy od dnia. Następnie możemy skorzystać z rozkładu dwumianowego, gdzie zdarzenie A- dzień będzie przepracowany z zyskiem, - bez zysku.

Prawdopodobieństwo, że wszystkie 6 dni zostaną przepracowane z zyskiem:

.

Ten sam wynik otrzymamy korzystając z funkcji MS Excel ROZKŁ.BINOM (wartość wartości całkowej wynosi 0):

P 6 (6 ) = ROZKŁ.BINOM(6; 6; 0,61; 0) = 0,052.

Prawdopodobieństwo, że z 6 dni 4 lub więcej dni zostanie przepracowanych z zyskiem:

Gdzie ,

,

Korzystając z funkcji MS Excel ROZKŁ.BINOM obliczamy prawdopodobieństwo, że z 6 dni nie więcej niż 3 dni zakończy się zyskiem (wartość wartości całkowej wynosi 1):

P 6 (≤3 ) = ROZKŁ.BINOM(3; 6; 0,61; 1) = 0,435.

Prawdopodobieństwo, że wszystkie 6 dni zostaną rozliczone ze stratami:

,

Ten sam wskaźnik możemy obliczyć korzystając z funkcji MS Excel ROZKŁ.BINOM:

P 6 (0 ) = ROZKŁ.BINOM(0; 6; 0,61; 0) = 0,0035.

Rozwiąż problem sam, a potem zobacz rozwiązanie

Przykład 2. W urnie znajdują się 2 kule białe i 3 czarne. Z urny wyjmuje się kulę, ustala kolor i odkłada z powrotem. Próbę powtarza się 5 razy. Liczba wystąpień białych kul jest dyskretną zmienną losową X, rozdzielone zgodnie z prawem dwumianu. Narysuj prawo rozkładu zmiennej losowej. Zdefiniuj modę, oczekiwanie matematyczne i dyspersję.

Kontynuujmy wspólne rozwiązywanie problemów

Przykład 3. Z firmy kurierskiej udaliśmy się na miejsce N= 5 kurierów. Każdy kurier najprawdopodobniej P= 0,3, niezależnie od innych, jest spóźniony dla obiektu. Dyskretna zmienna losowa X- liczba spóźnionych kurierów. Skonstruuj szereg rozkładów dla tej zmiennej losowej. Znajdź jego matematyczne oczekiwanie, wariancję, odchylenie standardowe. Znajdź prawdopodobieństwo, że co najmniej dwóch kurierów spóźni się na przesyłki.

Rozdział 7.

Specyficzne prawa rozkładu zmiennych losowych

Rodzaje praw rozkładu dyskretnych zmiennych losowych

Niech dyskretna zmienna losowa przyjmie wartości X 1 , X 2 , …, x rz,…. Prawdopodobieństwa tych wartości można obliczyć za pomocą różnych wzorów, na przykład korzystając z podstawowych twierdzeń teorii prawdopodobieństwa, wzoru Bernoulliego lub innych wzorów. W przypadku niektórych z tych formuł prawo dystrybucyjne ma swoją nazwę.

Najbardziej powszechnymi prawami rozkładu dyskretnej zmiennej losowej są prawo dwumianu, prawo geometryczne, hipergeometryczne i prawo rozkładu Poissona.

Prawo dystrybucji dwumianowej

Niech się wyprodukuje N niezależne badania, w każdym z których dane zdarzenie może się pojawić lub nie A. Prawdopodobieństwo wystąpienia tego zdarzenia w każdej pojedynczej próbie jest stałe, niezależne od numeru próby i wynosi: R=R(A). Stąd prawdopodobieństwo, że zdarzenie nie nastąpi A w każdym teście jest również stała i równa Q=1–R. Rozważ zmienną losową X równa liczbie wystąpień zdarzenia A V N testy. Oczywiście wartości tej wielkości są równe

X 1 =0 – zdarzenie A V N testy nie pojawiły się;

X 2 =1 – zdarzenie A V N pojawił się raz w próbach;

X 3 =2 – zdarzenie A V N testy pojawiły się dwukrotnie;

…………………………………………………………..

x rz +1 = N- wydarzenie A V N wszystko wyszło podczas testów N raz.

Prawdopodobieństwa tych wartości można obliczyć za pomocą wzoru Bernoulliego (4.1):

Gdzie Do=0, 1, 2, …,N .

Prawo dystrybucji dwumianowej X, równa liczbie sukcesów w N Testy Bernoulliego z prawdopodobieństwem powodzenia R.

Zatem dyskretna zmienna losowa ma rozkład dwumianowy (lub jest rozkładany zgodnie z prawem dwumianowym), jeśli jej możliwe wartości to 0, 1, 2, ..., N, a odpowiadające im prawdopodobieństwa oblicza się za pomocą wzoru (7.1).

Rozkład dwumianowy zależy od dwóch parametry R I N.

Szereg rozkładowy zmiennej losowej rozłożonej zgodnie z prawem dwumianu ma postać:

X k N
R

Przykład 7.1 . Do tarczy oddawane są trzy niezależne strzały. Prawdopodobieństwo trafienia każdego strzału wynosi 0,4. Zmienna losowa X– liczba trafień w cel. Skonstruuj jego szereg dystrybucyjny.

Rozwiązanie. Możliwe wartości zmiennej losowej X Czy X 1 =0; X 2 =1; X 3 =2; X 4 = 3. Znajdźmy odpowiednie prawdopodobieństwa, korzystając ze wzoru Bernoulliego. Nietrudno wykazać, że zastosowanie tej formuły jest w tym przypadku całkowicie uzasadnione. Należy pamiętać, że prawdopodobieństwo nietrafienia w cel jednym strzałem będzie wynosić 1-0,4=0,6. Dostajemy

Szereg rozkładowy ma następującą postać:

X
R 0,216 0,432 0,288 0,064

Łatwo sprawdzić, że suma wszystkich prawdopodobieństw jest równa 1. Sama zmienna losowa X rozdzielone zgodnie z prawem dwumianu. ■

Znajdźmy matematyczne oczekiwanie i wariancję zmiennej losowej rozłożonej zgodnie z prawem dwumianu.

Rozwiązując Przykład 6.5 wykazano, że matematyczne oczekiwanie liczby wystąpień zdarzenia A V N niezależne badania, jeżeli prawdopodobieństwo wystąpienia A w każdym teście jest stała i równa R, równa się N· R

W tym przykładzie wykorzystano zmienną losową o rozkładzie zgodnym z prawem dwumianu. Dlatego rozwiązanie Przykładu 6.5 jest zasadniczo dowodem następującego twierdzenia.

Twierdzenie 7.1. Oczekiwanie matematyczne dyskretnej zmiennej losowej o rozkładzie zgodnym z prawem dwumianu jest równe iloczynowi liczby prób i prawdopodobieństwa „sukcesu”, tj. M(X)=N· R.

Twierdzenie 7.2. Wariancja dyskretnej zmiennej losowej o rozkładzie zgodnym z prawem dwumianu jest równa iloczynowi liczby prób przez prawdopodobieństwo „sukcesu” i prawdopodobieństwo „porażki”, tj. D(X)=nr.

Asymetrię i kurtozę zmiennej losowej o rozkładzie zgodnym z prawem dwumianu wyznaczają wzory

Wzory te można otrzymać korzystając z koncepcji momentów początkowych i centralnych.

Prawo dystrybucji dwumianowej leży u podstaw wielu sytuacji z życia codziennego. Dla dużych wartości N Rozkład dwumianowy można aproksymować za pomocą innych rozkładów, w szczególności rozkładu Poissona.

Rozkład Poissona

Niech tak będzie N Testy Bernoulliego wraz z liczbą testów N wystarczająco duży. Wykazano wcześniej, że w tym przypadku (jeśli zresztą prawdopodobieństwo R wydarzenia A bardzo małe), aby znaleźć prawdopodobieństwo, że zdarzenie A pojawić się T Po zakończeniu testów możesz użyć wzoru Poissona (4.9). Jeśli zmienna losowa X oznacza liczbę wystąpień zdarzenia A V N Test Bernoulliego, to prawdopodobieństwo, że X przyjmie wartość k można obliczyć za pomocą wzoru

, (7.2)

Gdzie λ = nr.

Prawo rozkładu Poissona nazywa się rozkładem dyskretnej zmiennej losowej X, dla których możliwe wartości są nieujemnymi liczbami całkowitymi i prawdopodobieństwami rt wartości te można znaleźć za pomocą wzoru (7.2).

Ogrom λ = nr zwany parametr Rozkłady Poissona.

Zmienna losowa o rozkładzie zgodnym z prawem Poissona może przyjmować nieskończoną liczbę wartości. Ponieważ dla tego rozkładu prawdopodobieństwo R Występowanie zdarzenia w każdej próbie jest niewielkie, dlatego rozkład ten nazywa się czasem prawem rzadkich zdarzeń.

Szereg rozkładowy zmiennej losowej o rozkładzie zgodnym z prawem Poissona ma postać

X T
R

Łatwo sprawdzić, że suma prawdopodobieństw drugiego rzędu jest równa 1. Aby to zrobić, należy pamiętać, że funkcję można rozwinąć w szereg Maclaurina, który jest zbieżny dla dowolnego X. W tym przypadku mamy

. (7.3)

Jak zauważono, prawo Poissona zastępuje prawo dwumianu w pewnych ograniczających przypadkach. Przykładem jest zmienna losowa X, których wartości są równe liczbie awarii w pewnym okresie czasu podczas wielokrotnego użytkowania urządzenia technicznego. Zakłada się, że jest to urządzenie wysoce niezawodne, tj. Prawdopodobieństwo awarii w jednej aplikacji jest bardzo małe.

Oprócz takich przypadków granicznych w praktyce istnieją zmienne losowe o rozkładzie zgodnym z prawem Poissona, które nie są powiązane z rozkładem dwumianowym. Na przykład rozkład Poissona jest często używany do obliczania liczby zdarzeń zachodzących w danym okresie (liczba połączeń odebranych w centrali telefonicznej w ciągu godziny, liczba samochodów przyjeżdżających do myjni w ciągu dnia, liczba liczba przestojów maszyny w tygodniu itp.). Wszystkie te zdarzenia powinny tworzyć tzw. przepływ zdarzeń, co jest jednym z podstawowych pojęć teorii kolejkowania. Parametr λ charakteryzuje średnie natężenie przepływu zdarzeń.

Przykład 7.2 . Na wydziale studiuje 500 studentów. Jakie jest prawdopodobieństwo, że 1 września są urodziny trzech studentów tego wydziału?

Rozwiązanie . Od ilości studentów N= 500 jest dość duże i R– prawdopodobieństwo urodzenia się pierwszego września dla któregokolwiek z uczniów jest równe , tj. jest wystarczająco mała, to możemy założyć, że zmienna losowa X– liczba uczniów urodzonych 1 września jest rozdzielana zgodnie z prawem Poissona z parametrem λ = n.p.= = 1,36986. Następnie zgodnie ze wzorem (7.2) otrzymujemy

Twierdzenie 7.3. Niech zmienna losowa X rozłożone zgodnie z prawem Poissona. Wtedy jego matematyczne oczekiwanie i wariancja są sobie równe i równe wartości parametru λ , tj. M(X) = D(X) = λ = n.p..

Dowód. Z definicji oczekiwania matematycznego, korzystając ze wzoru (7.3) i szeregu rozkładów zmiennej losowej o rozkładzie zgodnym z prawem Poissona, otrzymujemy

Przed znalezieniem wariancji najpierw znajdujemy matematyczne oczekiwanie kwadratu rozważanej zmiennej losowej. Dostajemy

Stąd, z definicji dyspersji, otrzymujemy

Twierdzenie zostało udowodnione.

Wykorzystując pojęcia momentów początkowych i centralnych można wykazać, że dla zmiennej losowej o rozkładzie zgodnym z prawem Poissona współczynniki skośności i kurtozy wyznaczają wzory

Nietrudno to zrozumieć, biorąc pod uwagę treść semantyczną parametru λ = n.p. jest dodatnia, to zmienna losowa o rozkładzie zgodnym z prawem Poissona ma zawsze dodatnią skośność i kurtozę.

- (rozkład dwumianowy) Rozkład pozwalający obliczyć prawdopodobieństwo wystąpienia dowolnego zdarzenia losowego otrzymanego w wyniku obserwacji szeregu niezależnych zdarzeń, jeżeli prawdopodobieństwo wystąpienia jego elementarnych składowych... ... Słownik ekonomiczny

- (rozkład Bernoulliego) rozkład prawdopodobieństwa liczby wystąpień danego zdarzenia podczas powtarzanych niezależnych prób, jeżeli prawdopodobieństwo wystąpienia tego zdarzenia w każdej próbie jest równe p(0 p 1). Właśnie, numer? wystąpienia tego zdarzenia są... ... Wielki słownik encyklopedyczny

rozkład dwumianowy- - Tematyka telekomunikacji, podstawowe pojęcia EN rozkład dwumianowy ...

- (rozkład Bernoulliego), rozkład prawdopodobieństwa liczby wystąpień danego zdarzenia podczas powtarzanych niezależnych prób, jeżeli prawdopodobieństwo wystąpienia tego zdarzenia w każdej próbie jest równe p (0≤p≤1). Mianowicie liczba μ wystąpień tego zdarzenia... ... Słownik encyklopedyczny

rozkład dwumianowy- 1,49. rozkład dwumianowy Rozkład prawdopodobieństwa dyskretnej zmiennej losowej X, przyjmujący dowolne wartości całkowite od 0 do n, takie że dla x = 0, 1, 2, ..., n i parametrów n = 1, 2, ... i 0< p < 1, где Источник … Słownik-podręcznik terminów dokumentacji normatywnej i technicznej

Rozkład Bernoulliego, rozkład prawdopodobieństwa zmiennej losowej X, przyjmując odpowiednio wartości całkowite z prawdopodobieństwami (współczynnik dwumianu; parametr p B. r., zwany prawdopodobieństwem wyniku pozytywnego, przyjmując wartości ... Encyklopedia matematyczna

Rozkład prawdopodobieństwa liczby wystąpień określonego zdarzenia podczas powtarzanych niezależnych prób. Jeżeli podczas każdej próby prawdopodobieństwo wystąpienia zdarzenia jest równe p, gdzie 0 ≤ p ≤ 1, to liczba μ wystąpień tego zdarzenia dla n niezależnych... ... Duży Encyklopedia radziecka

- (rozkład Bernoulliego), rozkład prawdopodobieństwa liczby wystąpień danego zdarzenia podczas powtarzanych niezależnych prób, jeżeli prawdopodobieństwo wystąpienia tego zdarzenia w każdej próbie jest równe p (0<или = p < или = 1). Именно, число м появлений … Nauki przyrodnicze. Słownik encyklopedyczny

Dwumianowy rozkład prawdopodobieństwa- (rozkład dwumianowy) Rozkład obserwowany w przypadkach, gdy wynik każdego niezależnego eksperymentu (obserwacja statystyczna) przyjmuje jedną z dwóch możliwych wartości: zwycięstwo lub porażka, włączenie lub wykluczenie, plus lub ... Słownik ekonomiczno-matematyczny

dwumianowy rozkład prawdopodobieństwa- Rozkład obserwowany w przypadkach, gdy wynik każdego niezależnego eksperymentu (obserwacja statystyczna) przyjmuje jedną z dwóch możliwych wartości: zwycięstwo lub porażka, włączenie lub wykluczenie, plus lub minus, 0 lub 1. To znaczy... ... Przewodnik tłumacza technicznego

Książki

  • Teoria prawdopodobieństwa i statystyka matematyczna w zagadnieniach. Ponad 360 problemów i ćwiczeń, D. A. Borzykh. Proponowany podręcznik zawiera zadania o różnym stopniu złożoności. Główny nacisk położony jest jednak na zadania o średniej złożoności. Robimy to celowo, aby zachęcić uczniów do...
  • Teoria prawdopodobieństwa i statystyka matematyczna w problemach Ponad 360 problemów i ćwiczeń, D. Borzykh. Proponowany podręcznik zawiera problemy o różnym stopniu złożoności. Główny nacisk położony jest jednak na zadania o średniej złożoności. Robimy to celowo, aby zachęcić uczniów do...