If you're seeing this message, it means we're having trouble loading external resources on our website.

Hvis du sidder bag et internet-filter, skal du sikre, at domænerne *. kastatic.org og *.kasandbox.org ikke er blokeret.

Hovedindhold

Udledning af en populationsmiddelværdi ud fra en stikprøves middelværdi

Meget statistik er baseret på brug af data fra en stikprøve, der er repræsentativt for populationen som helhed. Fra stikprøvens middelværdi kan vi udlede ting om den større population. Vi forklarer dette nærmere. Lavet af Sal Khan.

Vil du deltage i samtalen?

Ingen opslag endnu.
Forstår du engelsk? Klik her for at se flere diskussioner på Khan Academys engelske side.

Video udskrift

Lad os sige, at vi skal opfinde en vare. Den er på en eller anden måde baseret på mænds højde. Varen skal sælges i USA, så vi vil gerne kende amerikanske mænds højde. Vi skal kende gennemsnitshøjden. Hvordan udregner vi gennemsnitshøjden? Der findes både geometriske gennemsnit og aritmetiske gennemsnit, men vi snakker her om det aritmetiske gennemsnit. Det betyder talgennemsnittet. Hvordan finder vi amerikanske mænds gennemsnitshøjde? En af måderne er at måle alle mænd i USA, lægge deres højder sammen og dividere med antallet af mænd. Så ville vi få den præcise gennemsnitshøjde. Spørgsmålet er dog, om det er det mest praktiske at gøre. Der er cirka 300 millioner mennesker i USA, så cirka halvdelen vil være mænd. Der er altså cirka 150 millioner mænd i USA. Så skulle vi måle alle sammen for at få den præcise gennemsnitshøjde. Det kan simpelthen ikke lade sig gøre. Når vi endelig var færdige, ville mange være døde, og mange nye ville være blevet født. Så kunne vi ikke bruge gennemsnittet mere. Det er altså næsten umuligt. Vi kan ikke måle alle mænd, men måske kan vi tage en stikprøve, hvor vi tilfældigt udvælger nogle mænd og måler dem. Det skal være tilfældigt, så det for eksempel ikke kun bliver nogle høje basketballspillere eller nogle dværge. Det skal være tilfældigt, så det viser et repræsentativt billede af alle mænd. Vi kan så udregne stikprøvens gennemsnit og få et fingerpeg om, hvad gennemsnitshøjden for alle er. Statistik går faktisk rigtig meget ud på at bruge information, vi kan udregne fra en stikprøve til at beskrive hele populationen. Populationen er alle de mennesker eller ting, vi vil vide noget om. Vi kan ofte ikke måle alle i en population. Spørgsmålet er nu, hvor mange mennesker man skal tage med i sin stikprøve. Nogle gange er 100 nok, og andre gange skal man måske bruge 1000. Lad os starte med 5 mænd. Vi måler 5 mænd. Den første er 6,2 fod høj. Det er en amerikansk måleenhed. Den næste er 5,5 fod høj. Den tredje er 5,75 fod. Den fjerde er 6,3 fod. Den femte og sidste er 5,9 fod. Det er vores stikprøve. Hvad er gennemsnitte? 6,2 plus 5,5 plus 5,75 plus 6,3 plus 5,9. Summen er 29,65. Vi skal dividere med antallet af mænd, så vi dividerer med 5. Det giver 5,93 fod. Her giver stikprøvens gennemsnit altså 5,93 fod. Det skriver vi som x med en streg over. Det er stikprøvens gennemsnit. Det er ikke nødvendigvis det samme som populationens gennemsnit. Når vi prøver at sige noget om hele populationen ud fra en stikprøve, kalder vi det statistik. Hvad kalder vi det, hvis vi kan måle hele populationens gennemsnit? Det kalder vi den sande middelværdi. Det hedder også forventningsværdien, og det er det sande gennemsnit for hele populationen. Vi bruger stikprøvens gennemsnit til at sige noget om den sande middelværdi. Middelværdien, som man skriver med det græske bogstav my, kaldes en statistisk deskriptor. Det er et flot ord for et tal, der beskriver en statistik. Vi bruger altså stikprøver til at få et fingerpeg om statistiske deskriptorer for en population. Det virker måske svært, men når man lige får en grundig forklaring, er det faktisk ikke det sværeste matematik. I løbet af de næste minutter kigger vi nærmere på det. Den sande middelværdi er gennemsnittet for hele populationen, altså alle 150 millioner. Stikprøvens gennemsnit er gennemsnittet for de her 5 personer. Vi håber så, at stikprøvens gennemsnit ligger tæt på den sande middelværdi. Hvordan bruger matematikere så alt det her med gennemsnit? Lad os først se på stikprøvens gennemsnit. Gennemsnit og middelværdi er i øvrigt det samme. Lad os først navngive stikprøvens data. Vi kalder dem x1, x2, x3, x4 og x5. Sådan ville det fortsætte med x6 og så videre, hvis der var flere tal. Nu skal vi tage summen af alle x'erne. Det skriver matematikerne sådan her. Stikprøvens gennemsnit er lig med summen af xi'erne. i'et dækker over x1, x2 og så videre. Hernede skriver vi, at i starter fra 1. Heroppe skriver vi, at det fortsætter til n, som er det højeste tal eller det sidste data. De her smarte bogstaver hernede betyder x1 plus x2 plus x3 hele vejen op til xn. I det her tilfælde er xn lig med x5. Kender vi gennemsnittet endnu? Nej, vi skal ikke kun lægge dem sammen. Vi skal dividere med antallet af data. Det kalder vi n. n er jo antallet af data i alt. Det ser meget kompliceret ud, men det betyder faktisk noget, vi allerede ved i forvejen. Det er en måde at skrive det på, så vi kan bruge det i flere tilfælde. Det betyder, at vi skal lægge dataene sammen og dividere med antallet af data i alt. Det her store, mærkelige bogstav hedder sigma, og det betyder sum. Det betyder, at vi skal lægge alle tallene fra x1 til xn sammen. Derefter skal vi dividere med n. Det var stikprøvens gennemsnit Hele populationens gennemsnit kalder vi my, altså den sande middelværdi. Igen tager vi summen. Den her gang er det dog summen af alle data i hele populationen. Det starter stadig ved i er lig med 1. For at vise, at det er hele populationen, skriver man ofte et stort N ovenover. Det store N står jo for at ret stort tal. Vi er dog ikke færdige. Igen skal vi dividere med antallet af data i alt. Det er stadig det samme som x1 plus x2 plus x3 hele vejen til xN. Det divideres med N. Stikprøven er altså en god måde at gøre arbejdet lettere for sig selv. I det her tilfælde målte vi ikke nok i stikprøven, men målet er at få et fingerpeg.