Din investeringsrådgiver foreslår deg en månedlig inntektsinvesteringsordning som lover en variabel avkastning hver måned. Du vil bare investere i det hvis du er trygg på gjennomsnittlig inntekt på $ 180. Din rådgiver forteller deg også at i løpet av de siste 300 månedene hadde ordningen retur med en gjennomsnittlig verdi på $ 190 og standardavviket på $ 75. Skal du investere i denne ordningen?
Hypotesetesting kommer til hjelp for slik beslutningstaking.
Denne artikkelen forutsetter lesernes kjennskap til begreper om en normalfordelingstabell, formel, p-verdi og relatert grunnleggende om statistikk.
For mer om praktiske anvendelser av data for å bestemme risiko, se "5 måter å måle gjensidig fondrisiko på."
Hypotesetesting (eller signifikant testing) er en matematisk modell for å teste et krav, en idé eller en hypotese om en parameter av interesse i et gitt befolkningssett ved bruk av data målt i et utvalgssett. Beregninger utføres på utvalgte prøver for å samle mer avgjørende opplysninger om egenskapene til hele befolkningen, noe som muliggjør en systematisk måte å teste på krav eller ideer om hele datasettet.
Her er et enkelt eksempel: (A) En skoleleder rapporterer at elevene i skolen sin score i gjennomsnitt 7 av 10 i eksamener. For å teste denne "hypotesen" registrerer vi karakterer på si 30 studenter (prøve) fra hele elevpopulasjonen på skolen (si 300) og beregner gjennomsnittet av prøven. Vi kan da sammenligne den (beregnede) prøven som er gjennomsnittlig for (rapportert) populasjonsmiddel og forsøke å bekrefte hypotesen.
Et annet eksempel: (B) Den årlige avkastningen på et bestemt aksjefond er 8%. Anta at fondet har eksistert i 20 år. Vi tar en tilfeldig prøve av årlig avkastning av fondet for, si fem år (prøve) og beregne dets gjennomsnitt. Vi sammenligner deretter den (beregnede) prøven gjennomsnittet for (hevdet) populasjonen som betyr å verifisere hypotesen.
Det finnes ulike metoder for hypotesetesting. Følgende fire grunnleggende trinn er involvert:
Trinn 1: Definer hypotesen:
Vanligvis er den rapporterte verdien (eller kravstatistikken) oppgitt som hypotesen og antas å være sann. For de ovennevnte eksemplene vil hypotesen være:
- Eksempel A: Studentene i skolen scorer i gjennomsnitt 7 ut 10 i eksamener
- Eksempel B: Årlig avkastning av fondet er 8% per år
Dette erklærte Beskrivelsen utgjør " Null-hypotesen (H 0 ) " og er antatt for å være sann. Som en juryprosedyre starter med å anta uskyld av den mistenkte etterfulgt av avgjørelse om antakelsen er feil. Tilsvarende begynner hypotesetesting ved å angi og antar "Null-hypotesen", og deretter bestemmer prosessen om antakelsen sannsynligvis vil være sann eller falsk.
Det viktige poenget å merke seg er at vi tester null hypotesen fordi det er et tvil om at det er gyldig. Uansett informasjon som er mot den oppgitte nullhypotesen, er tatt i Alternativ hypotesen (H 1 ). For de ovennevnte eksemplene vil alternative hypoteser være:
- Studentene scorer et gjennomsnitt som er ikke lik 7
- Årlig avkastning av fondet er ikke like til 8% per år
Sammendrag er alternativ hypotese en direkte motsetning til nullhypotesen.
Som i en forsøk antar juryen mistankens uskyld (null hypotesen). Anklageren må bevise ellers (alternativt). Tilsvarende må forskeren bevise at nullhypotesen er sann eller falsk. Hvis anklageren ikke klarer å bevise den alternative hypotesen, må juryen gi slipp på den "mistenkte" (basere avgjørelsen om null hypotesen). På samme måte, hvis forsker ikke klarer å vise alternative hypoteser (eller bare ikke gjør noe), antas null hypotesen å være sann.
Trinn 2: Angi avgjørelseskriterier
Kriteriene for avgjørelse må baseres på visse datasettparametere, og det er her forbindelsen til normal distribusjon kommer inn på bildet.
I henhold til standardstatistikkpostulatet om prøvetakingsfordeling, "For alle utvalgsstørrelser n er prøvetakingsfordelingen av X ^ t normal hvis befolkningen X fra hvilken prøven trekkes, blir normalt fordelt. "Sannsynlighetene for alle andre mulige prøveinnretninger man kan velge, er normalt fordelt på.
For e. g. , fastslå om gjennomsnittlig daglig avkastning, av noe aksje notert på XYZ aksjemarked, rundt nyttårs tid er større enn 2%.
H 0 : Null-hypotesen: middel = 2%
H 1 : Alternativ hypotese: gjennomsnittlig> 2% (Dette er det vi vil bevise)
Ta prøven (si 50 bestander ut av totalt 500) og beregne gjennomsnittet av prøven.
For en normal fordeling ligger 95% av verdiene innenfor 2 standardavvik fra populasjonsmiddelet. Derfor tillater denne normalfordeling og sentrale grenseforutsetning for prøvedatasettet oss å etablere 5% som et signifikansnivå. Det er fornuftig som under denne antagelsen, er det mindre enn en 5% sannsynlighet (100-95) for å få avvikere som er utenfor 2 standardavvik fra populasjonsmiddelet. Avhengig av datasettets art kan andre signifikansnivåer tas ved 1%, 5% eller 10%. For økonomiske beregninger (inkludert atferdsfinansiering) er 5% den allment aksepterte grensen. Hvis vi finner noen beregninger som går ut over de vanlige 2 standardavvikene, har vi et sterkt tilfelle av utjevninger for å avvise nullhypotesen. Standardavvik er svært viktig for å forstå statistiske data. Lær mer om dem ved å se Investopedias video på standardavvik.
Det er grafisk representert som følger:
I eksemplet ovenfor, hvis gjennomsnittet av prøven er mye større enn 2% (si 3,5%), avviser vi nullhypotesen.Den alternative hypotesen (gjennomsnittlig> 2%) aksepteres, noe som bekrefter at gjennomsnittlig daglig avkastning av aksjene faktisk er over 2%.
Men hvis gjennomsnittet av prøven ikke sannsynligvis vil være signifikant større enn 2% (og forbli på rundt 2,2%), kan vi IKKE avvise nullhypotesen. Utfordringen kommer på hvordan man skal bestemme seg for slike nærliggende saker. For å få en konklusjon fra utvalgte prøver og resultater, skal et nivå av betydning bestemmes, noe som gjør det mulig å konkludere om nullhypotesen. Den alternative hypotesen gjør det mulig å etablere nivået av betydning eller "kritisk verdi" -konsept for å bestemme seg for slike nærliggende tilfeller. I henhold til standarddefinisjonen er "En kritisk verdi en cutoff-verdi som definerer grensene utover hvilke mindre enn 5% av prøven middel kan oppnås dersom nullhypotesen er sant. Eksempelmidler oppnådd utover en kritisk verdi vil resultere i en beslutning om å avvise nullhypotesen. "I eksempelet ovenfor, hvis vi har definert den kritiske verdien som 2. 1%, og Beregnet gjennomsnitt kommer til 2. 2%, da avviser vi nullhypotesen. En kritisk verdi etablerer en klar avgrensning om aksept eller avvisning.
Flere eksempler å følge - Først, la oss se på noen flere sentrale skritt og konsepter.
Trinn 3: Beregn teststatistikken:
Dette trinnet omfatter å beregne de nødvendige figurene, kjent som teststatistikk (som gjennomsnitt, z-score, p-verdi, etc.) for den valgte prøven. De ulike verdiene som skal beregnes, er dekket i et senere avsnitt med eksempler.
Trinn 4: Lag konklusjoner om hypotesen
Med den beregnede verdien bestemmer du null-hypotesen. Hvis sannsynligheten for å få en prøveverdi er mindre enn 5%, er konklusjonen å nekte nullhypotesen. Ellers aksepterer og beholder nullhypotesen.
Typer feil i beslutningsprosesser:
Det kan være fire mulige utfall i prøvebasert beslutningsprosess med hensyn til riktig brukbarhet for hele befolkningen:
Beslutning om å beholde |
Beslutning om å avvise > Gjelder hele befolkningen | |
Korrekt |
Feil |
(TYPE 1 Feil - a) Gjelder ikke hele befolkningen |
Feil |
(TYPE 2 Feil - b) Korrekt |
"Korrekt" tilfeller er de der beslutningene tatt på prøvene virkelig gjelder for hele befolkningen. Feilene oppstår når man bestemmer seg for å beholde (eller avvise) nullhypotesen basert på prøveberegninger, men beslutningen gjelder ikke egentlig for hele befolkningen. Disse tilfellene utgjør type 1 (alfa) og type 2 (beta) feil, som angitt i tabellen ovenfor. |
Hvis du velger riktig kritisk verdi, kan du eliminere type 1-alfeil eller begrense dem til et akseptabelt område.
Alpha angir feilen på nivå av betydning, og bestemmes av forskeren. For å opprettholde standard 5% signifikans eller konfidensnivå for sannsynlighetsberegninger, beholdes dette ved 5%.
I henhold til gjeldende beslutningsprosesser og definisjoner:
"Dette (alpha) kriteriet er vanligvis satt til 0.05 (a = 0. 05), og vi sammenligner alfa-nivået med p-verdien. Når sannsynligheten for en Type I-feil er mindre enn 5% (p <0. 05), bestemmer vi å avvise nullhypotesen; ellers beholder vi nullhypotesen. "
- Den tekniske termen som brukes for denne sannsynligheten er
- p-verdi . Det er definert som "sannsynligheten for å oppnå et prøveutfall, gitt at verdien som er angitt i nullhypotesen, er sann. P-verdien for å oppnå et prøveutfall sammenlignes med nivået av betydning ". En Type II-feil, eller en betaveil, er definert som "sannsynligheten for feilaktig å beholde nullhypotesen, da den faktisk ikke er aktuell for hele befolkningen. "
- Noen få eksempler vil demonstrere denne og andre beregninger.
Eksempel 1. En månedlig inntektsinvesteringsordning eksisterer som lover variabel månedlig avkastning. En investor vil investere i det bare hvis han er trygg på gjennomsnittlig inntekt på 180 dollar. Han har et utvalg på 300 måneders avkastning som har et gjennomsnitt på $ 190 og standardavviket på $ 75. Skal han eller hun investere i denne ordningen?
La oss sette opp problemet. Investoren vil investere i ordningen dersom han eller hun er sikret sin ønskede gjennomsnittlige avkastning på $ 180. Her,
H
0 : Null-hypotesen: middel = 180 H
1 : Alternativ hypotese: middel> 180 Metode 1 -
Kritisk verdi tilnærming : Identifiser en kritisk verdi X
L for prøvemiddelet, som er stort nok til å avvise nullhypotesen - i. e. avslå nullhypotesen hvis prøven betyr> = kritisk verdi X L P (identifiser en Type I-alfafeil) = P (avvis H
0 gitt at H 0 er sant), som ville oppnås når prøvemiddel overstiger kritiske grenser i. e.
= P (gitt at H
0 er sant) = alfa Grafisk,
Tar alfa = 0. 05 (dvs. 5% signifikansnivå), Z
0. 05 = 1. 645 (fra Z-tabellen eller normalfordelingstabellen) => X
L = 180 +1. 645 * (75 / sqrt (300)) = 187. 12 Siden prøven er gjennomsnittlig (190) større enn kritisk verdi (187,12), nullstilles null hypotesen, og konklusjonen er at gjennomsnittlig månedlig avkastning er faktisk større enn $ 180, så investor kan vurdere å investere i denne ordningen.
Metode 2 - Bruke standardisert teststatistikk
: Man kan også bruke standardverdien z.
Teststatistikk, Z = (prøvemiddel - populasjonsmiddel) / (std-dev / sqrt (antall prøver) dvs.
Så blir avkastningsområdet
Z = (190-180) / 75 / sqrt (300)) = 2. 309
Vår avvisningsregion på 5% signifikansnivå er Z> Z
0. 05 = 1. 645 Siden Z = 2. 309 er større
Metode 3 - P-verdiberegning:
Vi tar sikte på å identifisere P (sample mean> = 190, når gjennomsnittlig = 180) < = P (Z> = (190-180) / (75 / sqrt (300))
= P (Z> = 2.309) = 0. 0084 = 0. 84%
Følgende tabell å konkludere p-verdi beregninger konkluderer med at det er bekreftet bevis på at gjennomsnittlig månedlig avkastning er høyere enn 180.
p-verdi
Inferens
mindre enn 1% |
Bekreftet bevis |
støtter alternativ hypotesen |
mellom 1% og 5% Sterkt bevis |
støtter alternativ hypotesen > mellom 5% og 10% |
Svakt bevis støtter alternativ hypotesen |
større enn 10% |
Ingen bevis Støtte alternative hypoteser |
Eksempel 2: En ny aksjemegler (XYZ) krav at hans megleringsrenter er lavere enn for din nåværende aksjemegler (ABC). Data tilgjengelig fra et uavhengig forskningsfirma indikerer at gjennomsnittlig og std-dev av alle ABC-meglerklienter er henholdsvis $ 18 og $ 6. |
En prøve på 100 klienter av ABC er tatt og meglerkostnader beregnes med de nye prisene på XYZ megler. Hvis gjennomsnittet av prøven er $ 18. 75 og std-dev er det samme ($ 6), kan noen avtale gjøres om forskjellen i gjennomsnittlig meglerregning mellom ABC og XYZ megler? H |
0
: Null-hypotesen: middel = 18
H 1 : Alternativ hypotese: middel 18 (Dette er det vi vil bevise)
Avvisningsregion: Z <= - z 2. 5 og Z> = Z
2. 5 (antar 5% signifikansnivå, delt 2. 5 hver på hver side) Z = (prøvemiddel - middel) / (std-dev / sqrt (antall prøver) = (18 75 - 18) / (6 / (sqrt (100)) = 1. 25 Denne beregnede Z-verdien faller mellom de to grensene definert av
- Z
2. 5
= -1 96 og Z
2. 5 = 1. 96. Dette konkluderer med at det ikke er tilstrekkelig bevis for at det er noen forskjell mellom prisen på din eksisterende og nye megler. Alternativt, P-verdien = P (Z1, 25) = 2 * 0. 1056 = 0. 2112 = 21. 12% som er større enn 0. 05 eller 5%, som fører til samme konklusjon.
Grafisk , er det representert av følgende:
Kritikkpoeng for hypotetisk testmetode:
-
Statistisk metode basert på forutsetninger
- Feil utsatt som detaljert i alfa- og beta-feil
- Tolkning av p-verdi kan være ambigøs, noe som fører til forvirrende resultater Bunnlinjen
Hypotesetesting tillater en matematisk modell å validere et krav eller en ide med sikkerhetsnivå. Men, som flertallet av statistiske verktøy og modeller, er dette også bundet av noen begrensninger. Bruken av denne modellen for å ta økonomiske beslutninger bør vurderes med kritikk, og holde alle avhengigheter i bakhodet. Alternative metoder som Bayesian Inference er også verdt å utforske for lignende analyser.
Inntekt relatert: Et nytt konsept i Medicare
Du kan gå på pensjon, men du kan aldri trekke seg fra inntektsskatt planlegging .
Er loven om tilbud og etterspørsel en lov eller bare en hypotese?
Lære om styrken og begrensningene i tilbud og etterspørsel økonomiske teorier, og hvordan de brukes til å forutse og styre nåværende økonomisk aktivitet.
Hvorfor er produktivitet et viktig konsept i økonomi?
Se hvorfor produktivitetsbegrepet er så viktig for å forstå økonomisk vekst, og hvorfor en levestandard tilsvarer produktiviteten direkte.