Carl Friedrich Gauss var en lysande matematiker som bodde i början av 1800-talet och gav världens kvadratiska ekvationer, metoder för minsta kvadratanalys och normal fördelning. Även om Pierre Simon LaPlace betraktades som den ursprungliga grundaren av den normala distributionen 1809, får Gauss ofta krediten för upptäckten, eftersom han skrev om konceptet tidigt och det har varit föremål för mycket studier av matematiker i 200 år. Faktum är att denna distribution ofta kallas "Gaussian Distribution." Hela undersökningen av statistik härstammar från Gauss och lät oss förstå marknader, priser och sannolikheter bland andra applikationer. Modern terminologi definierar den normala fördelningen som klockkurvan med "normala" parametrar. Och eftersom det enda sättet att förstå Gauss och klockkurvan är att förstå statistik kommer denna artikel att bygga en klockkurva och applicera den på ett handelsexempel.
Medel, median och läge
Tre metoder finns för att bestämma fördelningar: medel, median och mode. Medlen är fakturerade genom att lägga till alla poäng och dela med antalet poäng för att få genomsnittet. Median är fakturerad genom att lägga till de två mellannivåerna i ett prov och dela med två, eller helt enkelt bara ta medeltalet från en ordinär sekvens. Läge är det vanligaste av numren i en fördelning av värden. Den bästa metoden för att få insikt i en talföljd är att använda betyder eftersom det är medelvärdet för alla tal och är sålunda mest reflexiva för hela distributionen.
Detta var den gaussiska inställningen och hans föredragna metod. Vad vi mäter här är parametrar för central tendens, eller för att svara på var våra provresultat leder. För att förstå detta måste vi plotta våra poäng som börjar med 0 i mitten och plotta +1, +2 och +3 standardavvikelser till höger och -1, -2 och -3 till vänster, i förhållande till medelvärdet. " Noll "avser distributionsmedlet. (Många hedgefonder genomför matematiska strategier. Läs mer om Kvantitativ analys av hedgefonder och Multivariate Modeller: Monte Carlo Analysis .)
Standardavvikelse och varians
Om värdena följer ett normalt mönster kommer vi att hitta 68% av alla poäng faller inom -1 och +1 standardavvikelser, 95% faller inom två standardavvikelser och 99% faller inom tre standardavvikelser av medelvärdet. Men det här räcker inte för att berätta om kurvan. Vi behöver bestämma den faktiska variansen och andra kvantitativa och kvalitativa faktorer. Varianter svarar på hur spridningen av vår distribution är. Det kan finnas faktorer i möjligheterna till varför avvikelser i vårt urval och hjälper oss att förstå dessa outliers och hur de kan identifieras.Till exempel, om ett värde faller sex standardavvikelser över eller under medelvärdet kan det klassificeras som en outlier för analysens syfte.
Standardavvikelser är en viktig metrik som helt enkelt är variansens ruta. Moderna termer kallar denna dispersion. Vid en Gauss-fördelning kan vi känna till procentandelen av de poäng som faller inom plus eller minus 1, 2 eller 3 standardavvikelser från medelvärdet, om vi vet medel- och standardavvikelsen. Detta kallas förtroendeintervallet. Så här vet vi att 68% av fördelningarna faller inom plus eller minus 1 standardavvikelse, 95% inom plus eller minus två standardavvikelser och 99% inom plus eller minus 3 standardavvikelser. Gauss kallade dessa "sannolikhetsfunktioner". (För mer information om statistisk analys, kolla in Förstå volatilitetsåtgärder .)
Skew och Kurtosis
Hittills har denna artikel varit en förklaring av medelvärdet och de olika beräkningarna som hjälper oss att förklara det närmare. När vi en gång hade ritat våra distributionspoäng, drog vi i grunden vår klockkurva framför alla poäng, förutsatt att de hade normala egenskaper. Så här räcker det inte för att vi har svansar på vår kurva som behöver förklaring för att bättre förstå hela kurvan. För att göra detta går vi till tredje och fjärde stunderna av statistiken över fördelningen kallad skew och kurtosis.
Svaghetens svaghet mäter asymmetri av fördelningen. En positiv skev har en avvikelse från det medelvärde som är positivt och snett rätt, medan en negativ skev har en avvikelse från den genomsnittliga snedställda vänster. I huvudsak har fördelningen en tendens att vara skevad på en viss sida av medelvärdet. En symmetrisk skev har 0 varians som bildar en perfekt normal fördelning. När klockkurvan ritas först med en lång svans är detta positivt. Den långa svansen i början före klumpkurvan klarar sig negativt skevad. Om en fördelning är symmetrisk kommer summan av kubade avvikelser över medelvärdet att balansera de kubade avvikelserna under medelvärdet. En snedställd rätt fördelning kommer att ha en skev större än noll, medan en skev vänster fördelning kommer att ha en skev mindre än noll. (Kurvan kan vara ett kraftfullt handelsverktyg: för mer relaterad läsning hänvisas till Aktiemarknadsrisk: Wagging the Tails .)
Kurtosis förklarar fördelningens topp- och värdekoncentrationsegenskaper. En negativ överskott av kurtos, kallad platykurtos, karaktäriseras som en ganska platt fördelning där det finns en mindre koncentration av värden runt medelvärdet och svansarna är signifikant fetare än en mesokurtisk (normal) fördelning. Å andra sidan innehåller en leptokurtisk fördelning tunna svansar, eftersom mycket av data är koncentrerad till medelvärdet.
Skew är viktigare för att bedöma handelspositioner än kurtosis. Analys av räntebärande värdepapper kräver noggrann statistisk analys för att bestämma volatiliteten i en portfölj när räntorna varierar. Modeller för att förutsäga rörelseriktningen måste vara en faktor i skævhet och kurtos för att prognostisera en obligationsportföljs resultat.Dessa statistiska koncept tillämpas vidare för att bestämma prisrörelser för många andra finansiella instrument, såsom aktier, optioner och valutapar. Skews används för att mäta optionspriser genom mätning av underförstådda volatiliteter.
Tillämpa det på handel
Standardavvikelseåtgärder volatilitet och frågar vilken typ av resultatavkastning som kan förväntas. Mindre standardavvikelser kan innebära mindre risk för ett lager, medan högre volatilitet kan innebära en högre osäkerhet. Traders kan mäta stängningspriser från genomsnittet eftersom det är dispergerat från medelvärdet. Dispersionen mäter då skillnaden från verkligt värde till medelvärde. En större skillnad mellan de två innebär en högre standardavvikelse och volatilitet. Priser som avviker långt ifrån medelvärdet återgår ofta till medelvärdet, så att handlare kan utnyttja dessa situationer. Priser som handlar i ett litet sortiment är redo för en paus.
Den ofta använda tekniska indikatorn för standardavvikshandlingar är Bollinger Band®, eftersom de är ett mått på volatilitet som är inställd på två standardavvikelser för övre och nedre band med ett 21-dagars glidande medelvärde. Gaussdistributionen var bara början på förståelsen av marknadssannolikheter. Det ledde senare till Time Series och Garch Models, liksom fler tillämpningar av skew som Volatility Smile.
Hur man ljuger med finansiell statistik
Kan du verkligen lita på vad den finansiella tjänstesektorn ställer ut? Vi berättar om några knep som gömmer sanningen.
Vilka modeller ska jag använda för att göra arbitragehandel?
Lär dig om olika typer av arbitrage-modeller och -tekniker, och upptäck varför klassiska arbitrage möjligheter är mycket svåra att använda.
Varför bygger ekonomer antaganden i sina ekonomiska modeller?
Ta reda på varför ekonomer använder orealistiska antaganden i sina modeller för att tillämpa en version av den vetenskapliga metoden och göra förutsägelser.