If you're seeing this message, it means we're having trouble loading external resources on our website.

Hvis du sidder bag et internet-filter, skal du sikre, at domænerne *. kastatic.org og *.kasandbox.org ikke er blokeret.

Hovedindhold

ANOVA 3: Hypotesetest med F-statistik

Variansanalyse 3 - Hypotesetest med f-statistik. Lavet af Sal Khan.

Vil du deltage i samtalen?

Ingen opslag endnu.
Forstår du engelsk? Klik her for at se flere diskussioner på Khan Academys engelske side.

Video udskrift

I de sidste par videoer, har vi beregnet summen af variationer i disse 9 tal her. og det fik vi til 30, som er vores kvadratrodssum. Så spurgte vi os selv hvor stor en del af variansen skyldes forskelle i hver gruppe, overfor forskelle imellem grupperne. Derfor er vores kvadratrodssum i grupperne, vores varians i grupperne. Og det fik vi til 6. Og balancen af disse 30, balancen af denne varians kommer fra forskellen imellem grupperne, og den beregnede vi Her fik vi 24. Det vi skal gøre i denne video, er faktisk at benytte denne information, specielt disse statistiske beregninger, vi beregnede, for at foretage empirisk statistik for at komme til en slags konklusion, eller netop ikke at drage en konklusion. Det vi skal gøre er, at give disse grupper en sammenhæng. Vi har arbejdet med dem helt abstrakt, men vi skal forestille os at disse er resultatet af et slags eksperiment. Lad os sige, at vi giver 3 forskellige slags piller eller 3 forskellige slags mad til mennesker der deltager i en test. Og dette er resultatet af testen. Derfor er dette mad 1, mad 2, og den her ovre er mad 3. Vi vil finde ud af om den slags mad, menneskene spiser, når de starter testen, har effekt på deres resultat. Hvis vi ser på disse gennemsnit, ser det ud som om, at de yder bedre i gruppe 3 end de gør i gruppe 2 og 1. Men skyldes den forskel rent tilfælde? Eller kan det skyldes reelle forskelle. I denne gruppe af mennesker, hvem ville i gennemsnit vælge mad 3, fremfor mad 2 og 1? Derfor bilver spørgsmålet, er gennemsnitene det samme som det sande gennemsnit? Dette er en test baseret på 3 stikprøver. Men hvis vi kendte det sande gennemsnit for gruppen-- Så spørgsmålet er: Er gennemsnitet i populationen af menneskene der tager mad 1, det samme som for dem der tager mad 2? Det er åbenlyst, at vi aldrig vil kunne give mad til et hvert levende menneske som var i live, og så bede dem tage en test. Men der er et sandt gennemsnit, det er bare ikke rigtig målbart. Vores spørgsmål er; Er denne beregning lig gennemsnit 3, det sande gennemsnit 3. Og vores spørgsmål er, er disse lig med hinanden? For hvis de ikke er lig med hinanden, så betyder det at den slags mad, der er givet, har en slags effekt på hvordan menneskene yder i testen. Lad os prøve en lille hypotese test her. Lad os sige at min nul-hypotese er at gennemsnitene er de samme. Maden gør ingen forskel. "Mad gør ingen forskel". og at min alternative hypotese er at det gør en forskel. "Maden gør en forskel". og den måde man skal tænke på er at hvis maden ikke gør nogen forskel, vil gennemsnitet af grupperne være det samme. Gennemsnittet af gruppen der fik mad 1, vil være det samme som gruppen, der fik mad 2, som også vil være det samme som gruppen der fik mad 3. Hvis vores alternative hypotese er sand, vil disse gennemsnit ikke være helt det samme. Hvordan kan vi teste denne hypotese? Vi skal antage, at nul-hypotesen, er sand - det vi altid skal gøre når vi skal teste hypoteser er at vi antager at vores nul-hypotese er sand. For så til sidst at finde ud af, hvad sandsynligheden er for at få et bestemt udfald, som vil være så ekstrem? Vi har endnu ikke deffineret hvad dette svar er. Vi skal altså definere -- vi tager vores nul-hypotese og så skal vi definere et svar, vi kalder for F-statisik. Vores F-statistik som har en F fordeling -- og vi vil ikke gå meget i detaljen omkring F fordelingen. Men vi kan allerede tænke på det som forholdet mellem to normal-fordelinger (X^2) som enten har eller ikke har forskellige mængder af frihedsgrader. Vores F statistik vil være forholdet mellem vores kvadratsum imellem prøverne summen af kvadratter mellem divideret med vores frihedsgrader mellem - - og dette bliver nogle gange kaldt for gennemsnitskvadratterne mellem, MSB, det, divideret med summen af egne kvadratter det er det vi har gjort her, SSW, i blå, divideret med SSW divideret med frihedsgraderne for SSW og det blev m gange (n-1). Lad os nu se på hvad der sker lige her. Hvis dette tal, tælleren, er meget størrere end nævneren så fortæller det os at variationen i denne data mest skyldes forskellen imellem de reele gennemsnit og, at det i mindre grad skyldes variationen imellem gennemsnittene. Altså hvis tælleren er meget størrere end nævneren. Det skulle altså få os til at tro på at der er en forskel på det sande gennemsnit. Så hvis dette tal er virkeligt højt så fortæller det os, at der er en lavere sandsynlighed for at vores nul-hypotese er sand. Hvis dette tal er virkeligt lav og vores nævner er større, så betyder det at vores variation imellem hvert prøve, udgør en større del af den samlede variation end vores variation imellem prøverne Det betyder altså at vores variation imellem hvert af disse prøver udgør en større andel af den samlede variation overfor varationen imellem prøverne. Det vil få os til at tro at... Ja vi ved at en hver forskel vi ser mellem gennemsnittene er rent tilfælde. og det vil gøre det en lille smule sværrer for os at afvise nul-hypotesen. Lad os prøve og beregne det. I dette tilfælde er vores SSB, som vi beregnede her, til 24. og vi har 2 frihedsgrader. Og vores SSW er 6 og hvor mange frihedsgrader var det nu vi havde? det var 6. Altså 6 frihedsgrader. Det bliver altså 24 divideret med 2, som er 12, divideret med 1. Vores F statistik har vi derfor beregnet til 12. F står for Fischer, som er den biolog og statistiker der opfandt dette. Vores F statistik bliver 12. Vi vil opleve, at dette er ret højt tal. Noget vi dog har glemt at nævne er, at med alle hypotese test skal man bruge et signifikant niveau. Lad os sige, at signifikant niveauet som vi har fastsat for vores hypotese test er 10%. 0,10 - hvilket betyder at hvis vi antager vores nul hypotese, er der mindre end 10% chance for at få det resultat vi fik, for at få denne F statistik så skal vi afvise vores nul-hypotese Derfor skal vi finde ud af vores kritiske F statistik værdi, som, hvis får den værdi eller højere, er 10% og hvis den er størrer end vores kristiske F statistik værdi, så vil vi afvise vores nul-hypotese, hvis den er mindre, så kan vi ikke afvise nul-hypotesen. Vi vil ikke gå meget i dybden omkring F statistik, men vi kan være glade for at hver af disse kvadratsummer har en normal-fordeling (X^2). Dette har en normal-fordeling, og dette har en anden normal-fordeling (X^2) Dette er en normal-fordeling (X^2) med 2 frihedsgrader, dette er en normal-fordeling (X^2) med - og vi har ikke standardiseret den og alt det der - men rundt regnet en normal-fordeling (X^2) med 6 frihedsgrader. F statistikken er faktisk forholdet mellem to normal-fordelinger (X^2) Og vi får dette - dette er et screenshot fra en professors forelæsning på UCLA, vi håber ikke de har noget imod det, vi skal bruge os en F tabel som vi kan kigge i. Dette er sådan en F fordeling ser ud. Og den kommer tydeligvis til at se anderledes ud, alt afhængig af frihedsgraderne for tælleren og nævneren. Der er her 2 frihedsgrader at tænker på, tællerens frihedsgrader og nævnerens frihedsgrader Når det så er sagt, lad os så beregne den kritiske F statistisk værdi, når alpha er lig med 0,10 og vi vil rent faktisk bruge forskellige F tabeller for hvert alpha hvor vores tællers frihedsgrader er 2, og vores nævners frihedsgrader er 6. Hele denne tabel som vi har her er for alpha = 10% eller 0,10 og vores nævners frihedsgrader er 2 og vores tællers er 6. Derfor er vores kritiske F værdi 3,46. Vores kristiske F værdi er 3,46 - den værdi lige her er 3,46 den værdi som vi fik, baseret på vores data er meget højere end dette, langt højere. Det kommer til at have en meget meget lav p-værdi. Sandsynligheden for at få noget, som er så ekstremt ved rent tilfælde, når man antager nul hypotesen, er meget lav.Værdien er langt højere end vores kritiske F værdi ved et signifikant niveau på 10%. På grund af dette, kan vi afvise nul-hypotesen. Som får os til at tro, at der rent faktisk er en forskel på mængdens gennemsnit, hvilket fortæller os at der med sandsynlighed er en forskel på folks yde-evne ved en eksamen, hvis man giver dem hver sin mad.