Difference between revisions of "Binomial distribution/cs"
(Created page with "{{DISPLAYTITLE:Binomické rozdělení}} Přemýšleli jste někdy o tom, jak předpovědět počet úspěchů v sérii nezávislých pokusů? Nebo jste možná zvědaví na pr...") |
|||
Line 3: | Line 3: | ||
== Úvod == | == Úvod == | ||
− | [[File:Binomial-probability-distribution-sample-plot-example.png|thumb|500px|Pravděpodobnostní rozdělení pro experiment s mincí. Počet pokusů n = 10 a pravděpodobností úspěchu (pád orla při | + | [[File:Binomial-probability-distribution-sample-plot-example.png|thumb|500px|Pravděpodobnostní rozdělení pro experiment s mincí. Počet pokusů [[File:n.png|x8px]] = 10 a pravděpodobností úspěchu (pád orla při jedném hodu) [[File:P2.png|x10px]] = 0,5. <ref name="kumar"></ref>]] |
Přemýšlejme o následujících experimentech a náhodných veličinách: | Přemýšlejme o následujících experimentech a náhodných veličinách: | ||
− | # Házíme 10krát mincí. Označme [[File:X.png| | + | # Házíme 10krát mincí. Označme [[File:X.png|x15px]] počet kolikrát padne orel. |
− | # Stroj vyrábí díly a některé z nich jsou vadné. Označme [[File:X.png| | + | # Stroj vyrábí díly a některé z nich jsou vadné. Označme [[File:X.png|x15px]] jako počet vadných dílů ze 100 z nich náhodně vybraných. |
# Z celkového počtu pacientů trpících konkrétním onemocněním 35 % zažije zlepšení díky určitému léku. U následujících 1000 pacientů, kterým je podán ten samý lék, označme [[File:X.png|18px]] jako počet pacientů, kteří zpozorují zlepšení. | # Z celkového počtu pacientů trpících konkrétním onemocněním 35 % zažije zlepšení díky určitému léku. U následujících 1000 pacientů, kterým je podán ten samý lék, označme [[File:X.png|18px]] jako počet pacientů, kteří zpozorují zlepšení. | ||
− | # Test obsahuje 10 otázek s více možnými odpověďmi, každá s čtyřmi možnostmi, a vy hádáte u každé otázky. Označme [[File:X.png| | + | # Test obsahuje 10 otázek s více možnými odpověďmi, každá s čtyřmi možnostmi, a vy hádáte u každé otázky. Označme [[File:X.png|x15px]] jako počet správně zodpovězených otázek. |
− | Každý z těchto náhodných experimentů si lze představit jako soubor opakovaných náhodných pokusů: 10 hodů mincí nebo třeba 1000 pacientů užívajících lék. Náhodná veličina [[File:X.png| | + | Každý z těchto náhodných experimentů si lze představit jako soubor opakovaných náhodných pokusů: 10 hodů mincí nebo třeba 1000 pacientů užívajících lék. Náhodná veličina [[File:X.png|x15px]] je počet pokusů, které splňují určité kritérium. Výsledek každého pokusu buď splňuje kritérium, nebo ne; proto lze každý pokus shrnout jako „úspěch“ nebo „neúspěch“. Například v experimentu s testem je pro každou otázku pouze jedna kombinace možností, která je správná, a tedy považována za úspěch. |
− | Termíny „úspěch“ a „neúspěch“ jsou pouze označení. V případě experimentu 2 je vyrobení vadného dílu označováno jako „úspěch“, protože X počítá vadné díly. Stejně dobře můžeme použít označení „A“ a „B“ nebo „0“ a „1“. <ref name="kumar">KUMAR, Ajitesh <i>Binomial Distribution Explained with Examples</i> [online]. 2023 [cit. 2023-06-01] Dostupné z: https://vitalflux.com/binomial-distribution-defined-with-10-examples/</ref> <ref name="montgomery">MONTGOMERY, Douglas C. <i>Applied Statistics and Probability for Engineers</i> [online]. 2011 [cit. 2023-06-01] Dostupné z: https://industri.fatek.unpatti.ac.id/wp-content/uploads/2019/03/088-Applied-Statistics-and-Probability-for-Engineers-Douglas-C.-Montgomery-George-C.-Runger-Edisi-5-2011.pdf</ref> | + | Termíny „úspěch“ a „neúspěch“ jsou pouze označení. V případě experimentu 2 je vyrobení vadného dílu označováno jako „úspěch“, protože [[File:X.png|x15px]] počítá vadné díly. Stejně dobře můžeme použít označení „A“ a „B“ nebo „0“ a „1“. <ref name="kumar">KUMAR, Ajitesh <i>Binomial Distribution Explained with Examples</i> [online]. 2023 [cit. 2023-06-01] Dostupné z: https://vitalflux.com/binomial-distribution-defined-with-10-examples/</ref> <ref name="montgomery">MONTGOMERY, Douglas C. <i>Applied Statistics and Probability for Engineers</i> [online]. 2011 [cit. 2023-06-01] Dostupné z: https://industri.fatek.unpatti.ac.id/wp-content/uploads/2019/03/088-Applied-Statistics-and-Probability-for-Engineers-Douglas-C.-Montgomery-George-C.-Runger-Edisi-5-2011.pdf</ref> |
+ | |||
+ | == Terminologie == | ||
+ | === Binomický experiment === | ||
+ | Nebo také Bernoulliho experiment/Bernoulliho schéma jsme si v úvodu představili, pojďme si ho nadefinovat a formalizovat. | ||
+ | ==== Požadavky ==== | ||
+ | Požadavky pro to, aby náhodný experiment byl binomickým experimentem, jsou následující: | ||
+ | * Pevný počet ([[File:n.png|x15px]]) pokusů. | ||
+ | * Každý pokus musí být nezávislý na ostatních. (výsledek jednoho pokusu nemá žádný vliv na výsledek ostatních pokusů.) | ||
+ | * Každý pokus má právě dva možné výsledky, nazývané "úspěch" (výsledek, který nás zajímá) a "neúspěch". | ||
+ | * Existuje konstantní pravděpodobnost (pravděpodobnost, že pokus skončí „úspěchem“, je stejná v každém z pokusů) ([[File:p2.png|x15px]]) úspěchu pro každý pokus, přičemž doplňkem této pravděpodobnosti je pravděpodobnost „neúspěchu“, která se někdy označuje jako [[File:q-formula.png|x18px]]. | ||
+ | <ref name="kumar"></ref> <ref name="bolt">UF Health <i>Binomial Random Variables</i> [online]. 2014 [cit. 2023-06-01] Dostupné z: https://bolt.mph.ufl.edu/6050-6052/unit-3b/binomial-random-variables/</ref> | ||
+ | |||
+ | === Náhodná veličina === | ||
+ | Pro definici binomického rozdělení začneme s definicí náhodné veličiny [[File:X.png|x15px]]. Tu lze jednoduše definovat jako číselné vyjádření výsledku náhodného jevu. | ||
+ | |||
+ | === Binomická náhodná veličina === | ||
+ | V binomických náhodných experimentech je počet „úspěchů“ v n pokusech náhodný. Může nabývat celočíselných hodnot od 0, pokud všechny pokusy skončí „neúspěchem“, nebo může být tak vysoký jako je [[File:n.png|x12px]], pokud všechny pokusy skončí „úspěchem“. | ||
+ | Náhodná proměnná [[File:X.png|x15px]], která reprezentuje počet „úspěchů“ v těchto [[File:n.png|x12px]] pokusech, se nazývá '''binomická náhodná veličina''' a je určena hodnotami [[File:n.png|x12px]] a [[File:P2.png|x15px]]. | ||
+ | ==== Definice ==== | ||
+ | Binomická náhodná veličina [[File:X.png|x15px]] je definována jako počet výskytu události (úspěchů) v [[File:n.png|x12px]] Bernoulliho pokusech. | ||
+ | To, že má náhodná veličina binomické rozdělení zapisujeme: <ref name="vsb">VŠB <i>DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI</i> [online].[cit. 2023-06-01] Dostupné z: https://homel.vsb.cz/~dom033/predmety/statistika/ucebni_text/7DNV.pdf</ref> | ||
+ | |||
+ | [[File:vbr.png|x60px]] | ||
+ | |||
+ | ==== Příklad: Binomické nebo ne? ==== | ||
+ | Zvažme ještě několik náhodných experimentů. | ||
+ | U každého z nich rozhodneme, zda je náhodná proměnná binomická. Pokud je, určíme hodnoty pro [[File:n.png|x12px]] a [[File:P2.png|x15px]]. Pokud není, vysvětlíme proč. | ||
+ | ;Příklad A: | ||
+ | : Házíme spravedlivou kostkou 50krát; [[File:X.png|x15px]] je počet krát, kdy padla šestka. | ||
+ | : [[File:X.png|x15px]] '''je binomická''' s [[File:n.png|x12px]] = 50 a [[File:P2.png|x15px]] = 1/6. | ||
+ | ;Příklad B: | ||
+ | : Opět házíme spravedlivou kostkou, [[File:X.png|x15px]] je počet hodů potřebných k dosažení šestky. | ||
+ | : [[File:X.png|x15px]] '''není binomická''', protože počet pokusů není pevně stanovený. | ||
+ | ;Příklad C: | ||
+ | : Vybíráme náhodně 3 karty jednu po druhé, nevracíme je zpátky do balíčku, z klasické sady obsahující 4 druhy karet. [[File:X.png|x15px]] je počet vybraných karet se znakem srdce. | ||
+ | : [[File:X.png|x15px]] '''není binomická''', protože výběry nejsou nezávislé. (Pravděpodobnost úspěchu ([[File:P2.png|x15px]]) není konstantní, protože je ovlivněna předchozími výběry.) | ||
+ | ;Příklad D: | ||
+ | : Odpovídáme na 10 testových otázek zcela náhodně, prvních pět otázek je ano/ne a druhých pět otázek má čtyři možnosti, ze kterých je jedna správná. [[File:X.png|x15px]] představuje počet správných odpovědí. | ||
+ | : [[File:X.png|x15px]] '''není binomická''', protože pravděpodobnost [[File:P2.png|x15px]] se mění z 1/2 na 1/4. | ||
+ | ;Příklad E: | ||
+ | : Pravděpodobnost mít krevní skupinu B je 0,1. Vybíráme 4 náhodné osoby. [[File:X.png|x15px]] je počet osob s krevní skupinou B. | ||
+ | : [[File:X.png|x15px]] '''je binomická''' s [[File:n.png|x12px]] = 4 a [[File:P2.png|x15px]] = 0,1. | ||
+ | : ''Komentář: Při výběru relativně malé náhodné vzorky (4 osoby) z velké populace, i když se odběr provádí bez „náhrady“, můžeme předpokládat nezávislost, protože matematický vliv odstranění jednoho jedince z velké populace na další výběr je zanedbatelný.'' | ||
+ | <ref name="bolt"></ref> | ||
+ | |||
+ | === Binomické pravděpodobnostní rozdělení === | ||
+ | Nyní je čas diskutovat o pravděpodobnostním rozdělení binomické náhodné veličiny. Začneme jednoduchým příkladem a poté se přesuneme k obecnému vzorci. | ||
+ | ==== Příklad Přenosový kanál ==== | ||
= Citace = | = Citace = | ||
<references/> | <references/> |
Revision as of 20:25, 1 June 2023
Přemýšleli jste někdy o tom, jak předpovědět počet úspěchů v sérii nezávislých pokusů? Nebo jste možná zvědaví na pravděpodobnost dosažení konkrétního výsledku v sekvenci otázek s odpověďmi ano/ne? Pokud ano, hovoříme v podstatě o binomickém rozdělení, které se vztahuje k binomickým experimentům (tj. s binárními výsledky). Binomické rozdělení je důležitým konceptem v oblasti datové vědy a často se používá v rámci podnikových aplikací.
Contents
Úvod
Přemýšlejme o následujících experimentech a náhodných veličinách:
- Házíme 10krát mincí. Označme počet kolikrát padne orel.
- Stroj vyrábí díly a některé z nich jsou vadné. Označme jako počet vadných dílů ze 100 z nich náhodně vybraných.
- Z celkového počtu pacientů trpících konkrétním onemocněním 35 % zažije zlepšení díky určitému léku. U následujících 1000 pacientů, kterým je podán ten samý lék, označme jako počet pacientů, kteří zpozorují zlepšení.
- Test obsahuje 10 otázek s více možnými odpověďmi, každá s čtyřmi možnostmi, a vy hádáte u každé otázky. Označme jako počet správně zodpovězených otázek.
Každý z těchto náhodných experimentů si lze představit jako soubor opakovaných náhodných pokusů: 10 hodů mincí nebo třeba 1000 pacientů užívajících lék. Náhodná veličina je počet pokusů, které splňují určité kritérium. Výsledek každého pokusu buď splňuje kritérium, nebo ne; proto lze každý pokus shrnout jako „úspěch“ nebo „neúspěch“. Například v experimentu s testem je pro každou otázku pouze jedna kombinace možností, která je správná, a tedy považována za úspěch.
Termíny „úspěch“ a „neúspěch“ jsou pouze označení. V případě experimentu 2 je vyrobení vadného dílu označováno jako „úspěch“, protože počítá vadné díly. Stejně dobře můžeme použít označení „A“ a „B“ nebo „0“ a „1“. [1] [2]
Terminologie
Binomický experiment
Nebo také Bernoulliho experiment/Bernoulliho schéma jsme si v úvodu představili, pojďme si ho nadefinovat a formalizovat.
Požadavky
Požadavky pro to, aby náhodný experiment byl binomickým experimentem, jsou následující:
- Pevný počet () pokusů.
- Každý pokus musí být nezávislý na ostatních. (výsledek jednoho pokusu nemá žádný vliv na výsledek ostatních pokusů.)
- Každý pokus má právě dva možné výsledky, nazývané "úspěch" (výsledek, který nás zajímá) a "neúspěch".
- Existuje konstantní pravděpodobnost (pravděpodobnost, že pokus skončí „úspěchem“, je stejná v každém z pokusů) () úspěchu pro každý pokus, přičemž doplňkem této pravděpodobnosti je pravděpodobnost „neúspěchu“, která se někdy označuje jako .
Náhodná veličina
Pro definici binomického rozdělení začneme s definicí náhodné veličiny . Tu lze jednoduše definovat jako číselné vyjádření výsledku náhodného jevu.
Binomická náhodná veličina
V binomických náhodných experimentech je počet „úspěchů“ v n pokusech náhodný. Může nabývat celočíselných hodnot od 0, pokud všechny pokusy skončí „neúspěchem“, nebo může být tak vysoký jako je , pokud všechny pokusy skončí „úspěchem“. Náhodná proměnná , která reprezentuje počet „úspěchů“ v těchto pokusech, se nazývá binomická náhodná veličina a je určena hodnotami a .
Definice
Binomická náhodná veličina je definována jako počet výskytu události (úspěchů) v Bernoulliho pokusech. To, že má náhodná veličina binomické rozdělení zapisujeme: [4]
Příklad: Binomické nebo ne?
Zvažme ještě několik náhodných experimentů. U každého z nich rozhodneme, zda je náhodná proměnná binomická. Pokud je, určíme hodnoty pro a . Pokud není, vysvětlíme proč.
- Příklad A
- Házíme spravedlivou kostkou 50krát; je počet krát, kdy padla šestka.
- je binomická s = 50 a = 1/6.
- Příklad B
- Opět házíme spravedlivou kostkou, je počet hodů potřebných k dosažení šestky.
- není binomická, protože počet pokusů není pevně stanovený.
- Příklad C
- Vybíráme náhodně 3 karty jednu po druhé, nevracíme je zpátky do balíčku, z klasické sady obsahující 4 druhy karet. je počet vybraných karet se znakem srdce.
- není binomická, protože výběry nejsou nezávislé. (Pravděpodobnost úspěchu () není konstantní, protože je ovlivněna předchozími výběry.)
- Příklad D
- Odpovídáme na 10 testových otázek zcela náhodně, prvních pět otázek je ano/ne a druhých pět otázek má čtyři možnosti, ze kterých je jedna správná. představuje počet správných odpovědí.
- není binomická, protože pravděpodobnost se mění z 1/2 na 1/4.
- Příklad E
- Pravděpodobnost mít krevní skupinu B je 0,1. Vybíráme 4 náhodné osoby. je počet osob s krevní skupinou B.
- je binomická s = 4 a = 0,1.
- Komentář: Při výběru relativně malé náhodné vzorky (4 osoby) z velké populace, i když se odběr provádí bez „náhrady“, můžeme předpokládat nezávislost, protože matematický vliv odstranění jednoho jedince z velké populace na další výběr je zanedbatelný.
Binomické pravděpodobnostní rozdělení
Nyní je čas diskutovat o pravděpodobnostním rozdělení binomické náhodné veličiny. Začneme jednoduchým příkladem a poté se přesuneme k obecnému vzorci.
Příklad Přenosový kanál
Citace
- ↑ 1.0 1.1 1.2 KUMAR, Ajitesh Binomial Distribution Explained with Examples [online]. 2023 [cit. 2023-06-01] Dostupné z: https://vitalflux.com/binomial-distribution-defined-with-10-examples/
- ↑ MONTGOMERY, Douglas C. Applied Statistics and Probability for Engineers [online]. 2011 [cit. 2023-06-01] Dostupné z: https://industri.fatek.unpatti.ac.id/wp-content/uploads/2019/03/088-Applied-Statistics-and-Probability-for-Engineers-Douglas-C.-Montgomery-George-C.-Runger-Edisi-5-2011.pdf
- ↑ 3.0 3.1 UF Health Binomial Random Variables [online]. 2014 [cit. 2023-06-01] Dostupné z: https://bolt.mph.ufl.edu/6050-6052/unit-3b/binomial-random-variables/
- ↑ VŠB DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI [online].[cit. 2023-06-01] Dostupné z: https://homel.vsb.cz/~dom033/predmety/statistika/ucebni_text/7DNV.pdf