Den normala fördelningsformeln är baserad på två enkla parametrar - medelvärde och standardavvikelse - vilket kvantifierar egenskaper hos en given dataset. Medan medelvärdet anger "centralt" eller medelvärdet för hela datasetet indikerar standardavvikelsen "spridning" eller variation av datapunkter kring det genomsnittliga värdet.
Tänk på följande 2 dataset:
Dataset 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Dataset 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
För dataset1, medelvärde = 10 och standardavvikelse (stddev) = 0
För Dataset2, medelvärde = 10 och standardavvikelse (stddev) = 2. 83
Låt oss plotta dessa värden för DataSet1:
På samma sätt för DataSet2:
Den röda horisontella linjen i båda ovanstående diagram visar "medelvärdet" eller medelvärdet för varje dataset (10 i båda fallen). De rosa pilarna i den andra grafen indikerar spridningen eller variationen av datavärden från medelvärdet. Detta representeras av standardavvikelsevärdet på 2. 83 i fallet med DataSet2. Eftersom DataSet1 har alla värden samma (som 10 vardera) och inga variationer är stddev-värdet noll, och därför är inga rosa pilar tillämpliga.
Stddev-värdet har några signifikanta och användbara egenskaper som är mycket användbara vid dataanalys. För en normal fördelning är datavärdena symmetriskt fördelade på vardera sidan av medelvärdet. För varje normalt distribuerad dataset, diagramdiagram med stddev på horisontell axel och nr. av datavärdena på vertikal axel erhålls följande graf.
Egenskaper för en normal fördelning
- Den normala kurvan är symmetrisk om medelvärdet;
- Medeln är i mitten och delar upp området i två halvor;
- Den totala ytan under kurvan är lika med 1 för medelvärdet = 0 och stdev = 1;
- Fördelningen beskrivs fullständigt med dess medelvärde och stddev
Såsom framgår av ovanstående diagram representerar stddev följande:
- 68. 3% av datavärden ligger inom 1 standardavvikelse av medelvärdet (-1 till +1)
- 95. 4% av datavärden ligger inom 2 standardavvikelser av medelvärdet (-2 till +2)
- 99. 7% av datavärden ligger inom 3 standardavvikelser av medelvärdet (-3 till +3)
Området under den klockformade kurvan anger vid mätning den önskade sannolikheten för en given intervall:
- mindre än X: - e. g. sannolikheten för datavärden är mindre än 70
- större än X - e. g. sannolikheten för datavärden är större än 95
- mellan X 1 och X 2 - e. g. sannolikheten för datavärden mellan 65 och 85
där X är ett värde av intresse (exempel nedan).
Plottning och beräkning av området är inte alltid lämpligt, eftersom olika dataset har olika medelvärden och stddev-värden.För att underlätta en enhetlig standardmetod för enkla beräkningar och tillämplighet på verkliga problem, infördes standardkonvertering till Z-värden, som utgör delen av Normal Distribution Table .
Z = (X - mean) / stddev, där X är den slumpmässiga variabeln.
I grunden tvingar denna omvandling medelvärdet och stddev att standardiseras till 0 respektive 1, vilket gör att en standard definierad uppsättning Z-värden (från Normalt fördelningsbord ) kan användas för enkla beräkningar . Ett snapshot av standard z-värde-tabell med sannolikhetsvärden är följande:
z |
0. 00 |
0. 01 |
0. 02 |
0. 03 |
0. 04 |
0. 05 |
0. 06 |
0. 0 |
0. 00 tusen |
0. 00399 |
0. 00.798 |
0. 01.197 |
0. 01.595 |
0. 01994 |
… |
0. 1 |
0. 0398 |
0. 04380 |
0. 04.776 |
0. 05.172 |
0. 05.567 |
0. 05.966 |
… |
0. 2 |
0. 0793 |
0. 08.317 |
0. 08.706 |
0. 09.095 |
0. 09.483 |
0. 09.871 |
… |
0. 3 |
0. 11791 |
0. 12172 |
0. 12552 |
0. 12930 |
0. 13307 |
0. 13683 |
… |
0. 4 |
0. 15542 |
0. 15910 |
0. 16276 |
0. 16640 |
0. 17003 |
0. 17364 |
… |
0. 5 |
0. 19146 |
0. 19.497 |
0. 19.847 |
0. 20194 |
0. 20540 |
0. 20884 |
… |
0. 6 |
0. 22575 |
0. 22907 |
0. 23237 |
0. 23565 |
0. 23891 |
0. 24215 |
… |
0. 7 |
0. 25.804 |
0. 26115 |
0. 26.424 |
0. 26730 |
0. 27035 |
0. 27337 |
… |
… |
… |
… |
… |
… |
… |
För att hitta sannolikheten för z-värdet på 0. 239865 , avrunda den första gången till 2 decimaler (dvs. 0,24). Kontrollera sedan de första 2 signifikanta siffrorna (0. 2) i raderna och för minst signifikanta siffror (kvarvarande 04) i kolumnen. Det kommer att leda till värdet på 0. 09483. |
|
Den fullständiga normaldistributionstabellen, med precision upp till 5 decimaler för sannolikhetsvärden (inklusive de för negativa värden) finns här.
Låt oss se några exempel på verkliga livet. Höjd hos individer i en stor grupp följer ett normalt distributionsmönster. Antag att vi har en uppsättning av 100 personer vars höjder är registrerade och medelvärdet och stddev beräknas till respektive 66 respektive 6 tum.
Här är några exempelfrågor som enkelt kan besvaras med z-värde tabell:
Vad är sannolikheten för att en person i gruppen är 70 inches eller mindre?Frågan är att hitta
- kumulativt värde av
P (X <= 70) i. e. i hela datasetet på 100, hur många värden kommer att ligga mellan 0 och 70.
Vi behöver nu hitta P <= 0. 67) = 0. 24857 (från z-tabellen ovan)
i. e. Det finns en 24 857% sannolikhet att en individ i gruppen kommer att vara mindre än eller lika med 70 tum.
Men fortsätt - ovanstående är ofullständigt.Kom ihåg att vi letar efter sannolikheten för alla möjliga höjder upp till 70 i. e. från 0 till 70. Ovanstående ger dig bara delen från medelvärdet till önskat värde (t.ex. 66 till 70). Vi måste inkludera den andra halvan - från 0 till 66 - för att komma fram till rätt svar.
Eftersom 0 till 66 representerar halvdelen (dvs en extrem till medelvägsmedel) är sannolikheten helt enkelt 0. 5.
Därmed är den korrekta sannolikheten för att en person är 70 tum eller mindre = 0. 24857 + 0. 5 = 0. 74857 =
74. 857%
Grafiskt (genom att beräkna området) är dessa de två summerade regionerna som representerar lösningen: Vad är sannolikheten för att en person är 75 tum eller högre?
i. e. Hitta
- Complementary
kumulativa P (X> = 75). Z = (X - medelvärde) / stddev = (75-66) / 6 = 9/6 = 1. 5 P (Z> = 1,5) = 1 - P (Z <= 1. 5) = 1 - (0,5 + 0,43319) = 0. 06681 = 6. 681%
Vad är sannolikheten för att en person ligger mellan 52 tum och 67 tum?
Hitta P (52 <= x <= 67).
- P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2.33 <= z <= O. 17)
= P (Z <= 0,17) -p (Z <= -0,233) = (0,5 + 0,574949) - (.40905) =
Denna
normal distributionstabell
(och z-värden) brukar användas för eventuella sannolikhetsberäkningar på förväntade prisrörelser på aktiemarknaden för aktier och index. De används i branschbaserad handel, identifierar uptrend eller downtrend, support eller motståndsnivåer och andra tekniska indikatorer baserade på normala distributionsbegrepp med medel- och standardavvikelse.
Social trygghet 'Start, Stop, Start' Strategi förklarad
Start, stopp, start Social Security strategi är komplicerat. Här är vad pensionärer anser att det måste övervägas.
Social Security 'Start, Stop, Start' Strategi Förklarad
Start, stopp, start Social Security strategi är komplicerat. Här är vad pensionärer anser att det måste övervägas.
Adaptiv priszon Teknisk indikator Förklarad
På en hackig marknad kan följande diagram vara extremt svårt - APZs tekniska indikator kan bli din bästa vän.