Den normale fordelingsformelen er basert på to enkle parametre - gjennomsnitt og standardavvik - som kvantifiserer egenskaper av et gitt datasett. Mens gjennomsnittet indikerer "sentral" eller gjennomsnittsverdien av hele datasettet, angir standardavviket "spredning" eller variasjon av datapunkter rundt den gjennomsnittlige verdien.
Vurder følgende 2 datasett:
Datasett 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Datasett 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
For Datasett1, betyr = 10 og standardavvik (stddev) = 0
For Datasett2, mener = 10 og standardavvik (stddev) = 2. 83
La oss plotte disse verdiene for DataSet1:
Tilsvarende for DataSet2:
Den røde horisontale linjen i begge ovenstående grafer angir gjennomsnittlig eller gjennomsnittsverdi for hvert datasett (10 i begge tilfeller). De rosa pilene i den andre grafen viser spredningen eller variasjonen av dataverdier fra middelverdien. Dette er representert ved standardavviksverdi på 2. 83 i tilfelle DataSet2. Siden DataSet1 har alle verdier samme (som 10 hver) og ingen variasjoner, er stddev-verdien null, og derfor er det ingen rosa piler.
Stddev-verdien har noen få signifikante og nyttige egenskaper som er svært nyttige i dataanalyse. For en normal fordeling er dataverdiene symmetrisk fordelt på hver side av gjennomsnittet. For ethvert normalt distribuert datasett, plottegraf med stddev på horisontal akse og nr. av dataverdier på vertikal akse, oppnås følgende graf.
Egenskaper for en normalfordeling
- Den normale kurven er symmetrisk om gjennomsnittet;
- Midlet er på midten og deler området i to halvdeler;
- Det totale arealet under kurven er lik 1 for gjennomsnittlig = 0 og stdev = 1;
- Fordelingen er fullstendig beskrevet av dens gjennomsnitt og stddev
Som det fremgår av diagrammet ovenfor, representerer stddev følgende:
- 68. 3% av dataverdiene ligger innenfor 1 standardavvik av gjennomsnittet (-1 til +1)
- 95. 4% av dataverdiene ligger innenfor 2 standardavvik av gjennomsnittet (-2 til +2)
- 99. 7% av dataverdiene ligger innenfor 3 standardavvik av gjennomsnittet (-3 til +3)
Området under den klokkeformede kurven, når målt, indikerer ønsket sannsynlighet for en gitt rekkevidde:
- mindre enn X: - e. g. Sannsynlighet for at dataverdier er mindre enn 70
- større enn X - e. g. Sannsynlighet for at dataverdier er større enn 95
- mellom X 1 og X 2 - e. g. Sannsynlighet for dataværdi mellom 65 og 85
hvor X er en verdi av interesse (eksempler nedenfor).
Plotting og beregning av området er ikke alltid praktisk, da forskjellige datasett vil ha forskjellige gjennomsnittlige og stddev-verdier.For å lette en ensartet standardmetode for enkle beregninger og anvendelighet til virkelige problemer i verden, ble standardkonvertering til Z-verdier introdusert, som utgjør delen av Normal Fordelingstabell .
Z = (X - mean) / stddev, hvor X er tilfeldig variabel.
Denne konverteringen tvinger i utgangspunktet gjennomsnittet og stddev til å standardiseres til henholdsvis 0 og 1, noe som gjør at et standard definert sett av Z-verdier (fra Normalfordelingstabell ) kan brukes til enkle beregninger . Et snapshot av standard z-verdi-tabell med sannsynlighetsverdier er som følger:
z |
0. 00 |
0. 01 |
0. 02 |
0. 03 |
0. 04 |
0. 05 |
0. 06 |
0. 0 |
0. 00000 |
0. 00399 |
0. 00798 |
0. 01197 |
0. 01595 |
0. 01994 |
… |
0. 1 |
0. 0398 |
0. 04380 |
0. 04776 |
0. 05172 |
0. 05567 |
0. 05966 |
… |
0. 2 |
0. 0793 |
0. 08317 |
0. 08706 |
0. 09095 |
0. 09483 |
0. 09871 |
… |
0. 3 |
0. 11791 |
0. 12172 |
0. 12552 |
0. 12930 |
0. 13307 |
0. 13683 |
… |
0. 4 |
0. 15542 |
0. 15910 |
0. 16276 |
0. 16640 |
0. 17003 |
0. 17364 |
… |
0. 5 |
0. 19146 |
0. 19497 |
0. 19847 |
0. 20194 |
0. 20540 |
0. 20884 |
… |
0. 6 |
0. 22575 |
0. 22907 |
0. 23237 |
0. 23565 |
0. 23891 |
0. 24215 |
… |
0. 7 |
0. 25804 |
0. 26115 |
0. 26424 |
0. 26730 |
0. 27035 |
0. 27337 |
… |
… |
… |
… |
… |
… |
… |
For å finne sannsynligheten knyttet til z-verdien på 0. 239865 , første runde av den til 2 desimaler (dvs. 0. 24). Sjekk deretter de første 2 signifikante sifrene (0. 2) i radene og for minst signifikante sifferet (resterende 0. 04) i kolonnen. Det vil føre til verdien av 0. 09483. |
|
Her finner du full normalfordelingstabell med presisjon opptil 5 desimaltall for sannsynlighetsverdier (inkludert de for negative verdier).
La oss se noen virkelige eksempler. Høyde på individer i en stor gruppe følger et normalt distribusjonsmønster. Anta at vi har et sett på 100 individer hvis høyder er registrert og gjennomsnittet og stddev er beregnet til henholdsvis 66 og 6 tommer.
Her er noen eksempler på spørsmål som enkelt kan besvares ved hjelp av z-verdi tabellen:
Hva er sannsynligheten for at en person i gruppen er 70 tommer eller mindre?Spørsmålet er å finne
- kumulativ verdi på
P (X <= 70) i. e. i hele datasettet på 100, hvor mange verdier vil være mellom 0 og 70.
Vi må nå finne P <= 0. 67) = 0. 24857 (fra z-tabellen over)
i. e. Det er en 24 857% sannsynlighet for at et individ i gruppen vil være mindre enn eller lik 70 tommer.
Men hold på - ovennevnte er ufullstendig.Husk at vi ser etter sannsynligheten for alle mulige høyder opptil 70 i. e. fra 0 til 70. Ovennevnte gir deg bare delen fra gjennomsnittlig til ønsket verdi (f.eks. 66 til 70). Vi må inkludere den andre halvdelen - fra 0 til 66 - for å komme frem til det riktige svaret.
Siden 0 til 66 representerer halvparten (dvs. en ekstreme til middelveismiddel), er sannsynligheten bare 0. 5.
Derfor er den riktige sannsynligheten for at en person er 70 tommer eller mindre = 0. 24857 + 0. 5 = 0. 74857 =
74. 857%
Grafisk (ved å beregne området) er disse de to summerte områdene som representerer løsningen: Hva er sannsynligheten for at en person er 75 tommer eller høyere?
i. e. Finn
- Komplementær
kumulative P (X> = 75). Z = (X - middel) / stddev = (75-66) / 6 = 9/6 = 1. 5 P (Z> = 1,5) = 1 P (Z <= 1. 5) = 1 - (0. 5 + 0, 43319) = 0. 06681 = 6. 681%
Hva er sannsynligheten for at en person er mellom 52 tommer og 67 tommer?
Finn P (52 <= x <= 67).
- P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2.33 <= z <= 0. 17)
= P (Z <= 0,17) -p (Z <= -0,233) = (0,55-0,5749) - (.40905) =
Denne
normal distribusjonstabell
(og z-verdier) finner vanligvis bruk for eventuelle sannsynlighetsberegninger på forventede prisbevegelser på aksjemarkedet for aksjer og indekser. De brukes i rekkevidde basert handel, identifisere uptrend eller downtrend, støtte eller motstand nivåer, og andre tekniske indikatorer basert på normale distribusjonskonsepter av gjennomsnittlig og standardavvik.
DOL Fiduciary Rule Forklart 31. august 2017
DOL Fiduciary Rule Forklart 31. august 2017
Sosial sikkerhet 'Start, Stopp, Start' Strategi Forklart
Start, stop, start Social Security strategi er komplisert. Her er det pensjonister som vurderer det, må vurdere.