Din investeringsrådgivare föreslår ett månatligt inkomstinvesteringssystem som lovar en rörlig avkastning varje månad. Du kommer endast att investera i det om du är säker på ett genomsnitt på $ 180 månadsinkomst. Din rådgivare berättar också att systemet under de senaste 300 månaderna har returnerat med ett medelvärde på $ 190 och standardavvikelsen på $ 75. Ska du investera i detta schema?
Hypotesprovning kommer till stöd för sådant beslutsfattande.
Denna artikel förutsätter läsarnas förtrogenhet med begreppen normal tabell, formel, p-värde och relaterad grunder i statistiken.
För mer om praktiska tillämpningar av data för att bestämma risken, se "5 sätt att mäta ömsesidig fondrisk".
Hypotestestning (eller signifikanstest) är en matematisk modell för att testa ett krav, en idé eller en hypotes om en parameter av intresse för en given population, med användning av data mätt i en provuppsättning. Beräkningar utförs på utvalda prov för att samla mer avgörande information om egenskaperna hos hela befolkningen, vilket möjliggör ett systematiskt sätt att testa påståenden eller idéer om hela datasetet.
Här är ett enkelt exempel: (A) En skolpresentant rapporterar att eleverna i hennes skola gör ett genomsnitt på 7 av 10 i tentor. För att testa den här "hypotesen" registrerar vi betyg på säga 30 studenter (prov) från skolans hela studentpopulation (säg 300) och beräkna medelvärdet av provet. Vi kan sedan jämföra (beräknat) provmedelvärdet till (rapporterat) populationens medelvärde och försöka bekräfta hypotesen.
Ett annat exempel: (B) Den årliga avkastningen på en viss fond är 8%. Antag att fond har funnits i 20 år. Vi tar ett slumpmässigt urval av fondens årliga avkastning för fem år (prov) och beräknar dess genomsnittliga värde. Vi jämför sedan det (beräknade) provmedlet till den (påstådda) populationen för att verifiera hypotesen.
Det finns olika metoder för hypotesprövning. Följande fyra grundläggande steg är inblandade:
Steg 1: Definiera hypotesen:
Vanligtvis anges det rapporterade värdet (eller kravstatistiken) som hypotesen och antas vara sann. För ovanstående exempel kommer hypotesen att vara:
- Exempel A: Studerande i skolan gör i genomsnitt 7 till 10 i tentor
- Exempel B: Årlig avkastning på fonden är 8% per år
Detta anges Beskrivningen utgör " Null-hypotesen (H 0 ) " och är antagen för att vara sant. Liksom en jurynförsök börjar med att anta den misstänks oskyldighet följt av beslutsamhet om antagandet är felaktigt. På liknande sätt börjar hypotesprovningen genom att ange och antar "Null-hypotesen", och sedan bestämmer processen om antagandet sannolikt är sann eller falskt.
Det viktiga att notera är att vi testar nollhypotesen eftersom det finns ett tvivel om dess giltighet. Vilken information som helst mot den angivna nollhypotesen fångas i Alternativ hypotesen (H 1 ). För de ovanstående exemplen kommer alternativ hypotes att vara:
- Studerande gör ett medelvärde som är inte lika med 7
- Årlig avkastning av fondet är inte lika till 8% per år
Sammanfattningsvis är alternativ hypotes en direkt motsägelse mot nollhypotesen.
Som i en försök utgår juryns misstänktes oskuld (null hypotes). Åklagaren måste bevisa annorlunda (alternativt). På samma sätt måste forskaren bevisa att nollhypotesen är antingen sann eller falsk. Om åklagaren misslyckas med att bevisa den alternativa hypotesen måste juryn släppa "misstänkt" (baserar beslutet om nollhypotesen). På samma sätt, om forskaren inte visar på alternativ hypotes (eller helt enkelt inte gör någonting), antas noll hypotesen vara sant.
Steg 2: Ange beslutskriterierna
Beslutskriterierna måste baseras på vissa parametrar av dataset och det är här anslutningen till normal distribution kommer in i bilden.
Enligt standardstatistikpostulatet om provtagningsfördelning, "För varje provstorlek n är samplingsfördelningen av X ^^ normal om populationen X från vilken provet ritas fördelas normalt. "Sannolikheterna för alla andra möjliga provmedel som man kunde välja är normalt fördelade.
För e. g. , bestämma om den genomsnittliga dagliga avkastningen, av alla aktier som är noterade på XYZ-börsen, är ungefär nyårstid över 2%.
H 0 : Null-hypotes: medelvärde = 2%
H 1 : Alternativ hypotes: medelvärde> 2% (Detta är vad vi vill bevisa)
Ta provet (säg av 50 bestånd av totalt 500) och beräkna medelvärdet av provet.
För normal distribution ligger 95% av värdena inom 2 standardavvikelser för populationsmedelvärdet. Följaktligen tillåter detta normala distributions- och centralgränsanslag för provdatasetet oss att etablera 5% som en signifikansnivå. Det är meningsfullt att enligt detta antagande finns det mindre än en 5% sannolikhet (100-95) för att få outliers som ligger utanför 2 standardavvikelser från populationens medelvärde. Beroende på datasetets natur kan andra betydelsenivåer tas vid 1%, 5% eller 10%. För finansiella beräkningar (inklusive beteendefinansiering) är 5% den allmänt accepterade gränsen. Om vi finner några beräkningar som går utöver de vanliga 2 standardavvikelserna, har vi ett starkt fall av outliers för att avvisa nollhypotesen. Standardavvikelser är ytterst viktiga för att förstå statistiska data. Läs mer om dem genom att titta på Investopedias video om standardavvikelser.
Det representeras grafiskt enligt följande:
I det ovanstående exemplet, om medelvärdet av provet är mycket större än 2% (säg 3,5%), avvisar vi nollhypotesen.Den alternativa hypotesen (medelvärde> 2%) accepteras, vilket bekräftar att den genomsnittliga dagliga avkastningen på aktierna faktiskt överstiger 2%.
Om medelvärdet av provet sannolikt inte kommer att vara signifikant större än 2% (och förblir omkring 2,2%), kan vi INTE avvisa nollhypotesen. Utmaningen handlar om hur man bestämmer sig för sådana närliggande fall. För att göra en slutsats från valda prov och resultat ska en nivå av betydelse bestämmas, vilket möjliggör en slutsats om nollhypotesen. Den alternativa hypotesen möjliggör fastställande av signifikansnivå eller "kritiskt värde" -koncept för att avgöra sådana fall av fall. Enligt standarddefinitionen är "Ett kritiskt värde ett cutoff-värde som definierar gränserna över vilka mindre än 5% av provet medel kan erhållas om nollhypotesen är sant. Provmedel som erhållits utöver ett kritiskt värde kommer att resultera i ett beslut att avvisa nollhypotesen. "I det ovanstående exemplet, om vi har definierat det kritiska värdet som 2. 1% och beräknat medelvärde kommer till 2,2%, då avvisar vi nollhypotesen. Ett kritiskt värde upprättar en tydlig avgränsning om godkännande eller avslag.
Fler exempel att följa - Låt oss först titta på några fler nyckelsteg och begrepp.
Steg 3: Beräkna teststatistiken:
Detta steg innefattar att beräkna de önskade siffrorna, som kallas teststatistik (som medelvärde, z-poäng, p-värde, etc.) för det valda provet. De olika värden som ska beräknas är täckta i ett senare avsnitt med exempel.
Steg 4: Gör slutsatser om hypotesen
Med beräknade värden bestämmer du nollhypotesen. Om sannolikheten för att få ett medelvärde är mindre än 5%, är slutsatsen att neka nollhypotesen. Annars accepterar och behåller nollhypotesen.
Typer av fel vid beslutsfattande:
Det kan finnas fyra möjliga resultat i provbaserat beslutsfattande med avseende på korrekt tillämplighet för hela befolkningen:
Beslut att behålla |
Beslut att avvisa > Gäller hela befolkningen | |
Korrigera |
Felaktigt |
(TYP 1 Fel - a) Gäller inte hela befolkningen |
Felaktig |
(TYP 2 Fel - b) Korrigera |
De "korrekta" fallen är de där de beslut som fattas på proverna verkligen gäller för hela befolkningen. Felaktigheterna uppstår när man beslutar att behålla (eller avvisa) nollhypotesen baserad på provberäkningar, men det beslutet gäller inte egentligen hela befolkningen. Dessa fall utgör typ 1 (alfa) och typ 2 (beta) fel, som anges i tabellen ovan. |
Genom att välja rätt kritiskt värde kan du eliminera typ 1-alfafel eller begränsa dem till ett acceptabelt område.
Alpha anger felet på nivå av betydelse och bestäms av forskaren. För att upprätthålla standardvärdet på 5% eller konfidensnivå för sannolikhetsberäkningar behålls detta vid 5%.
Enligt de tillämpliga riktlinjerna för beslutsfattande och definitioner:
"Detta (alfakriterium) är vanligen satt till 0.05 (a = 0. 05), och vi jämför alfa-nivån med p-värdet. När sannolikheten för ett typ I-fel är mindre än 5% (p <0, 05), bestämmer vi oss för att neka hypotesen; Annars behåller vi nollhypotesen. "
- Den tekniska termen som används för denna sannolikhet är
- p-värde . Det definieras som "sannolikheten för att få ett provresultat, med tanke på att det värde som anges i nollhypotesen är sant. P-värdet för att erhålla ett provutfall jämförs med nivån av betydelse ". Ett typ II-fel eller betfel definieras som "sannolikheten att felaktigt behåller nollhypotesen, när den i själva verket inte är tillämplig på hela befolkningen. "
- Några fler exempel kommer att demonstrera denna och andra beräkningar.
Exempel 1. Ett månatligt inkomstinvesteringssystem existerar som lovar varierande månatlig avkastning. En investerare kommer bara att investera i det om han är säker på en genomsnittlig 180-månadslön. Han har ett urval av 300 månaders avkastning, vilket har ett medelvärde på $ 190 och standardavvikelsen på $ 75. Bör han eller hon investera i detta system?
Låt oss sätta upp problemet. Investeraren kommer att investera i systemet om han eller hon är säker på sin önskade genomsnittliga avkastning på 180 USD. Här,
H
0 : Null-hypotes: medelvärde = 180 H
1 : Alternativ hypotes: medelvärde> 180 Metod 1 -
Kritisk värdeanslutning : Identifiera ett kritiskt värde X
L för provmedlet, vilket är tillräckligt stort för att avvisa nollhypotesen - i. e. avvisa nollhypotesen om provet betyder> = kritiskt värde X L P (identifiera ett typ I-alfafel) = P (avvisa H
0 med tanke på att H 0 är sant), som skulle uppnås när provmedelvärdet överstiger de kritiska gränserna i. e.
= P (med tanke på att H
0 är sant) = alfa Grafiskt
Med alfa = 0. 05 (dvs 5% signifikansnivå), Z
0. 05 = 1. 645 (från Z-tabellen eller det normala distributionsbordet) => X
L = 180 +1. 645 * (75 / sqrt (300)) = 187. 12 Eftersom provvärdet (190) är större än det kritiska värdet (187.12), avvisas nollhypotesen och slutsatsen är att den genomsnittliga månatliga avkastningen är faktiskt större än 180 dollar, så investeraren kan överväga att investera i detta system.
Metod 2 - Använda standardiserad teststatistik
: Man kan också använda det standardiserade värdet z.
Teststatistik, Z = (provmedelvärde - populationsmedelvärde) / (std-dev / sqrt (antal prov) dvs.
Då blir avvisningsregionen
Z = (190-180) / 75 / sqrt (300)) = 2. 309
Vår avvisningsregion vid 5% signifikansnivå är Z> Z
0. 05 = 1. 645 Eftersom Z = 2. 309 är större
Metod 3 - P-värdesberäkning:
Vi strävar efter att identifiera P (medelvärde> = 190, när medelvärdet = 180)
= P (Z> = 2.909) = 0. 0084 = 0. 84%
Följande tabell att utgå från p-värde beräkningar drar slutsatsen att det finns bekräftat bevis på att genomsnittlig månatlig avkastning är högre än 180.
p-värde
Inferens
mindre än 1% |
Bekräftat bevis |
stödja alternativ hypotes |
mellan 1% och 5% Starkt bevis |
stödja alternativ hypotes > mellan 5% och 10% |
svag bevisning stödande alternativ hypotes |
större än 10% |
Inga bevis stödja alternativ hypotesen |
Exempel 2: En ny aktiemäklare (XYZ) att hans mäklaresatser är lägre än din nuvarande börsmäklare (ABC). Data som är tillgängliga från ett oberoende forskningsföretag tyder på att medel- och std-dev för alla ABC-mäklare är 18 respektive 6 dollar. |
Ett urval av 100 kunder i ABC tas och mäklaravgifterna beräknas med de nya priserna på XYZ-mäklaren. Om medelvärdet av provet är $ 18. 75 och std-dev är samma ($ 6), kan någon inferens göras om skillnaden i den genomsnittliga mäklarräkningen mellan ABC och XYZ mäklare? H |
0
: Null-hypotes: medelvärde = 18
H 1 : Alternativ hypotes: medel 18 (Detta är vad vi vill bevisa)
Avvisningsregion: Z <= - z 2. 5 och Z> = Z
2. Z = (medelvärde för medelvärde) / (std-dev / sqrt (antal prov) = (18) . 75 - 18) / (6 / (sqrt (100)) = 1. 25 Detta beräknade Z-värde faller mellan de två gränserna som definieras av - Z
2. 5
= -1 96 och Z
2. 5
= 1. 96. Detta drar slutsatsen att det inte finns tillräckliga bevis för att det finns någon skillnad mellan räntorna hos din befintliga och nya mäklare. Alternativt, P-värdet = P (Z1, 25) = 2 * 0. 1056 = 0. 2112 = 21. 12% som är större än 0. 05 eller 5%, vilket leder till samma slutsats. Grafiskt , representeras av följande:
Kritikpunkter för hypotetisk testmetod:
-
Statistisk metod baserad på antaganden
- Felaktigt som detaljerad när det gäller alfa- och beta-fel
- Tolkning av p-värde kan vara ambigöst, vilket leder till förvirrande resultat
Bottom Line Hypotestestning tillåter en matematisk modell att validera ett krav eller en idé med viss konfidensnivå. Men liksom majoriteten av statistiska verktyg och modeller är detta också bunden av några begränsningar. Användningen av denna modell för att fatta ekonomiska beslut bör övervägas med kritik, med hänsyn till alla beroenden. Alternativa metoder som Bayesian Inference är också värda att utforska för liknande analyser.
RIA-tester Robo-Advisors by Investing With Them
Vilket bättre sätt att testa prestanda hos 12 robo-rådgivare genom att investera med dem?
Förbered dig för dina CFA-tester
Ta reda på hur du gör dig redo för dessa långvariga och ofta skrämmande tentor.
ÄR lagen om tillgång och efterfrågan en lag eller bara en hypotes?
Lär dig om styrkorna och begränsningarna i utbud och efterfrågan av ekonomiska teorier, och hur de används för att förutse och styra den nuvarande ekonomiska aktiviteten.