If you're seeing this message, it means we're having trouble loading external resources on our website.

Hvis du sidder bag et internet-filter, skal du sikre, at domænerne *. kastatic.org og *.kasandbox.org ikke er blokeret.

Hovedindhold

ANOVA 1: Beregning af SST (samlet kvadrat(afvigelses)sum)

Analyse af Varians 1 - Beregning af SST (samlet kvadrat(afvigelses)sum). Lavet af Sal Khan.

Video udskrift

I denne video, og i de næste videoer, skal vi se på en række udregninger omkring dette datasæt lige her. og forhåbentligt, ved at gennegå disse beregninger, vil vi kunne få en intuitiv fornemmelse om hvad denne varians- analyse handler om. Det første vi skal gøre i denne video, er at beregne den totale kvadrat-sum. Så det kalder vi TKS (SST). Totale kvadrat-sum. Og den udgør tælleren når vi skal beregne variansen. Vi finder forskellen mellem hvert af disse tal tager gennemsnittet af dem, herefter kvadratet og så finder vi summen. Vi dividerer egentligt ikke med frihedsgraden, hvilket man normalt ville gøre hvis man skulle beregne variansen. Men hvad bliver det? Det første vi skal gøre, er at beregne gennemsnittet af alle disse tal her. Vi kalder det for det totale gennemsnit. Lad os vise, at det er det samme som gennemsnittet af alle gennemsnit af disse tal. Lad os beregne det totale gennemsnit. Det bliver 3 + 2 + 1, 3 + 2 + 1 + 5 + 3 + 4 + 5 + 6 + 7 ... plus 5 + 6 + 7 Og så har vi 9 tal. Vi har 9 tal, så derfor skal vi dividere med 9. Så bliver det lig med: 3 + 2 + 1 er 6. Det skriver vi lige her. 5 + 3 + 4, det er 12. Og så 5 + 6 + 7 er 18. Og så 6 + 12 er 18 + en til 18 er 36. divideret med 9 giver det 4. Lad os vise, at det er præcis det samme som gennemsnittet af gennemsnittene. Så gennemsnittet af den første gruppe her, som står med grøn er 3 + 2 + 1, det giver 6, divideret med 3, det bliver 2. Gennemsnittet af gruppe 2: summen er 12, det så vi lige her, 5 + 3 + 4 er 12, divideret med 3 er 4. Og så bliver gennemsnittet af gruppe 3: 5 + 6 + 7, det bliver 18. 18 divideret med 3 giver 6. Så hvis vi tager gennemsnittet af gennemsnittene som er det totale gennemsnit, har vi 2 + 4 + 6 som er 12, divideret med de 3 gennemsnit her, så får vi også 4. Så vi kan betragte det som gennemsnittet af alle tallene i alle 3 grupper eller som gennemsnittet af gennemsnittet for hver af disse grupper. Uanset hvad, så kommer vi frem til det samme, og nu kan vi finde den totale kvadratsum. Så lad os gøre det. Så det bliver lig med 3 - 4, det er 4-tallet lige her, i anden plus 2 - 4 i anden + 1 - 4 i anden, nu tager vi de tal herovre i anden række: + 5 - 4 i anden + 3 - 4 i anden + 4 - 4 i anden Vi rykker lige skærmen lidt. Nu har vi kun 3 tal tilbage. + 5 - 4 i anden + 6 - 4 i anden plus 7 - 4 i anden. Og hvad bliver det? Først har vi 3 - 4, det giver minus 1, men fordi vi opløfter det i anden får vi altså plus 1, eller bare 1, plus Her har vi minus 2 i anden, som giver 4 + minus 3 i anden, det giver 9. Og så bruger vi lige den anden farve. 5 - 4 er 1, opløftet i anden er det stadig 1. 3 - 4 i anden er 1, og 4 - 4 i anden er 0, men vi skriver det alligevel her for at vise at vi har husket at regne det ud. Og så har vi de sidste 3 datasæt. 5 - 4 i anden, giver 1. 6 - 4 i anden giver 4, det er det samme som 2 i anden, + 7 - 4 giver 3 opløftet i anden giver det 9. Hvad bliver den totale kvadratsum så? Vi har 1 + 4 + 9 her ovre, det er 5 + 9. Det giver 14. Det må også give 14 herovre til højre, da det er de samme tal. Og til sidst har vi 1 plus 1 her i midten, og det bliver 2. Så vi har 2 gange 14, det er 28, plus 2, det giver 30. Så det er vores totale kvadratsum Og faktisk, hvis vi ville have variansen skulle vi dividere dette med frihedsgraden. Og de her er flere gange frihedsgraden. Så lad os sige, lad os sige at vi har m grupper her. Vi skriver lige m her. Og vi skal ikke bevise det stringent, men vi skal vise hvor nogle af disse underlige formler i statistik kommer fra, så vi har en ide om det. Vi har m grupper her og hver gruppe har n medlemmer. Så hvor mange medlemmer har vi så? Vi har m gange n, eller i vore tilfælde 9. Det vil sige i alt 3 gange 3 medlemmer. Så frihedsgraden er - uanset hvor mange tal man har - antal tal, minus 1. Hvis vi kender gennemsnittet af alle gennemsnit, så behøver man kun at sige n minus 1. Her altså 9 minus 1. Kun 8 af disse tal vil give os ny information, for hvis du kender 8 tal, og gennemsnittet af alle gennemsnit, så kan du beregne det sidste tal, eller det behøver ikke engang at være den sidste, hvis vi kender de andre 8, så kan vi beregne denne. Så hvis man har 8 af dem, kan man altid beregne det 9'ende tal, ved at bruge gennemsnittet af alle gennemsnit. En måde at tænke på det på er, at der kun er 8 selvstændige tal her. Hvis vi ser på det mere generelt, er der m gange n, som giver antal tal, minus 1 frihedsgrad. Hvis vi vil beregne variansen her, dividerer vi bare 30 med m gange n, minus 1. Sagt på en anden måde, 8 frihedsgrader i dette eksempel. Vi tager 30 divideret med 8 og det giver rent faktisk variansen for denne gruppe med 9 tal. Vi slutter denne video. I den næste video skal vi prøve at finde ud af hvor stor en del af denne samlede varians, der kommer fra hver sin del af denne gruppe overfor afvigelsen imellem grupperne. Vi tror at, vi vil få en forståelse for, hvor hele denne varians-analyse kommer fra. Her er variansen for hele denne samling af 9 tal, men dele af variansen, hvis disse grupper er forskellige fra hinanden, vil komme fra den forskellighed der findes imellem grupperne, over for variansen som kommer inde fra gruppen. Vi skal beregne disse to ting og vi vil se at de kommer til gå op i den samlede kvadrat sum varians.