Maskrosätande

Idag är det onsdag, och som utlovat ska vi idag utreda om gröna slajmar har ett annat förhållande till maskrosor än röda slajmar. Det stämmer, idag är det statistik på agendan!

Vi har tidigare i bloggen kollat på hur stor andel av farmaren Frans kunder som är nöjda med den slajm som han levererar (84% av alla kunder är nöjda med Slajm). Men denna gång vill vi kolla på andelar på ett annat sätt. Farmaren Frans har upptäckt några av hans slajmklumpar inte verkar tycka om de maskrosor som serveras. Han misstänker att de röda slajmarna inte har tillnärmelsevis lika stor aptit för de frekventa blommorna som de gröna slajmarna.

Frans har gott minne över hur den sifferkunnige Samantha hjälpte honom tidigare (Ska jag bry mig om 1 ml hit eller dit?). Sam kunde såklart hjälpa honom även denna gång, så tillsammans utformade de ett enkelt protokoll och iakttog de slajmklumpar som idag fanns i maskroshagen. Protokollet blev en enkel tabell som såg ut så här:

Slajmklumpar som tog för sig av blommorna räknades till de som ”gärna” äter maskrosor. De slajmklumpar som kom fram och sniffade på blommorna utan att äta räknades till de som ”kanske” äter maskrosor. De slajmklumpar som inte åt, och inte sniffade blommorna räknades till de som ”inte alls” äter maskrosor. Som tur gick det ganska enkelt att räkna och hålla reda på alla slajmar eftersom Frans känner sina slajmklumpar så bra. Så efter en dag i maskroshagen hade Frans och Sam fått fram följande resultat:

”Varför har du skrivit dit en massa extra siffror?” frågade Frans.
”Jo du ser att gröna slajmar är 36 stycken, och det finns 24 röda. Det är det som jag skrivit upp till höger”, svarade Sam.
”Okej, men varför har du skrivit summor för varje kolumn? Vad ska det vara bra för?”
”Åh, jag är inte helt klar. Vänta!”

Sam började frenetiskt skriva upp siffror. Först skrev hon 60 i mörkblått i nedre högra hörnet av tabellen.
”Det är summan av alla slajmklumpar som varit i hagen idag.”
Därefter började hon räkna på vad hon kallade var ”de förväntade antalet slajmklumpar för varje cell”. Det hon menade var att man kan förvänta sig att visst många slajmklumpar kommer fördela sig i kategorierna ”gärna”, ”kanske” och ”inte alls” på ett visst sätt om det inte finns någon skillnad mellan röda och gröna slajmare. Det hon vill undersöka är om det stämmer det som Frans påstår: att det finns en skillnad.

Efter att ha räknat ett tag har Sam skrivit upp hur många slajmklumpar det kommer finnas i varje cell om det inte är någon skillnad mellan röda och gröna slajmklumpar. Enligt hennes beräkning kan man förvänta sig att 17 gröna slajmklumpar ”gärna” äter maskrosor. Men resultatet de fick var att 18 stycken gröna slajmare gärna äter blommorna. Har Sam fått ett signifikant resultat? Det verkar som att övriga förväntade resultat ligger nära det uppmäta resultatet! Sam får fortsätta räkna.

Hon börjar med att beräkna hur stor den genomsnittliga avvikelsen är och hur långt det ifrån det förväntade värdet de uppmätta värdena är. Hon använder sig av chi2:

Detta innebär att för varje cell så gör hon en beräkning enligt ovanstående formel och summerar dem.

Sam hade nu fått fram chi2 = 0,66. Med hjälp av en chi2-fördelningskurva så hade nu Sam ett mått på hur stor sannolikheten är att de skillnader mot förväntade antal skulle uppstå av slumpen. Om hon har liten sannolikhet så kan hon utesluta att det inte skulle finnas någon skillnad mellan röda och gröna slajmar. Vad är då sannolikheten?

Till sin hjälp har Sam chi2-fördelningskurva och uträkning av grader av frihet. Grader av frihet räknar hon fram genom att ta antalet rader minus ett gånger antalet kolumner minus ett: (3-1)(2-1)=2. Hon får fram följande graf där det färgade området är sannolikheten att få så stor avvikelse eller större av slumpen. Svaret? 72%!

Sam kunde inte ge stöd åt Frans hypotes. Det verkar som att det för närvarande inte är någon skillnad om röda eller gröna slajmar kommer äta maskrosor. Med Sams hjälp har Frans nu kommit fram till att alla slajmklumpar gott kan få fortsätta dela på maskroshagen.