Hur gör man en post hoc test
Användning från brev Hoc-tester tillsammans med anova
post hoc-tester existerar ett integrerad sektion från ANOVA. då ni använder ANOVA på grund av för att testa jämlikheten hos minimalt tre gruppmedel indikerar statistiskt signifikanta effekt för att ej samtliga gruppmedel existerar lika. ANOVA-resultaten identifierar emellertid ej vilka särskilda skillnader mellan par från medel såsom existerar signifikanta. Använd brev hoc-tester till för att utforska skillnader mellan flera gruppmedel samtidigt likt ni kontrollerar den experimentella felfrekvensen.,
inom detta på denna plats inlägget visar jag dig vilka brev hoc-analyser såsom existerar, dem kritiska fördelarna dem tillhandahåller samt hjälper dig för att välja korrekt till din lärande. Dessutom visar jag varför underlåtenhet för att granska den experimentella felfrekvensen kommer för att leda mot för att ni besitter allvarliga tvivel ifall dina resultat.
börja tillsammans med Anova Omnibus-testet
vanligtvis, då ni önskar besluta ifall tre alternativt flera medel existerar olika, utför ni ANOVA. Statistiker hänvisar mot ANOVA F-testet vilket en omnibus-test. Welch ANOVA existerar enstaka ytterligare typ från omnibus test.,
ett omnibus-test ger omfattande effekt till dina uppgifter. Sammantaget existerar skillnaderna mellan medlen statistiskt signifikanta—Ja alternativt Nej?
angående p-värdet ifrån ditt ANOVA F-test alternativt Welchs test existerar mindre än din signifikansnivå är kapabel ni neka nollhypotesen.
- Null: samtliga grupporgan existerar lika.
- alternativ: ej samtliga gruppmedel existerar lika.
ANOVA-testresultaten kartlägger dock ej vilka grupper vilket skiljer sig ifrån andra grupper., likt ni kunna titta ifrån hypoteserna ovan, ifall ni kunna neka null, vet ni bara för att ej samtliga medel existerar lika. Ibland behöver ni verkligen känna till vilka grupper likt skiljer sig avsevärt ifrån andra grupper!
: hur F-tester fungerar inom ANOVA samt Welchs ANOVA
exempel enkelriktad ANOVA för att nyttja tillsammans brev Hoc-tester
vi börjar tillsammans detta enkelriktad ANOVA modell, samt sedan nyttja den på grund av för att illustrera tre brev hoc-tester inom all detta blogginlägg. Tänk dig för att oss provar fyra ämne liksom oss överväger till för att utföra enstaka produktdel., oss önskar att fatta beslut eller bestämma något angående dem genomsnittliga skillnaderna mellan styrkorna hos dessa fyra ämne existerar statistiskt signifikanta. oss får nästa envägsresultat ANOVA. på grund av för att följa tillsammans detta modell, ladda ner CSV dataset: PostHocTests.
p-värdet vid 0,004 indikerar för att oss är kapabel neka nollhypotesen samt dra slutsatsen för att dem fyra medlen ej existerar samtliga lika. Tabellen medel längst bort ner visar gruppen medel. dock oss vet ej vilka par från grupper likt existerar viktigt olika.,
till för att jämföra gruppmedel måste oss utföra brev hoc-tester, även kända vilket flera jämförelser. vid Latin betyder brev hoc ” efter detta.”Du utför brev hoc-analyser efter en statistiskt signifikant omnibustest (F-test alternativt Welchs).
innan oss kommer mot dessa gruppjämförelser måste ni lära dig ifall den experimentella felfrekvensen.
: hur man tolkar p-värden precis samt hur man utför Envägsanova inom Excel
Vad existerar den experimentella felfrekvensen?
brev hoc-tester utför numeriskt värde viktiga uppgifter., Ja, dem berättar vilka gruppmedel såsom skiljer sig viktigt ifrån andra gruppmedel. kritisk, dem kontrollerar även experimentet-wise, alternativt familywise, felfrekvens. inom detta kontext existerar experimentvisa, familjevisa samt familjefelfrekvenser varenda synonymer likt jag bör nyttja omväxlande.
vad existerar den denna plats experimentella felfrekvensen? på grund av varenda hypotestest ni utför finns detta enstaka typ i-felfrekvens, såsom din signifikansnivå (alfa) definierar. tillsammans med andra mening finns detta enstaka chans för att ni kommer för att neka enstaka nollhypotes liksom faktiskt existerar sant—det existerar enstaka falsk positiv., då ni bara utför en test motsvarar typ i-felfrekvensen din signifikansnivå, vilket ofta existerar 5%. dock då ni utför fler samt fler tester ökar din chans mot ett falsk positiv. ifall ni utför tillräckligt tillsammans tester, existerar ni nästan garanterad för att ett fåtal enstaka falsk positiv! Felfrekvensen till ett testfamilj existerar ständigt högre än en individuellt test.
Tänk dig för att ni rullar en par tärningar samt rullar numeriskt värde (kallas snake eyes) representerar en typ i-fel. Sannolikheten till snake eyes till enstaka enda rulle existerar ~ 2.8% snarare än 5%, dock ni får idén., angående ni rullar tärningarna bara enstaka gång existerar dina chanser för att rulla ormögon ej sålunda dåliga. dock ju fler gånger ni rullar tärningarna, desto mer sannolikt får ni numeriskt värde. tillsammans 25 rullar blir ormögon mer troliga än ej (50,8%). tillsammans tillräckligt tillsammans med rullar blir detta oundvikligt.
: typer från fel inom hypotesprovning samt Signifikansnivåer samt p-värden
familjefel inom ANOVA
inom ANOVA-sammanhanget önskar ni jämföra gruppmedlen. Ju fler grupper ni besitter, desto fler jämförelsetester måste ni utföra., till vårt modell ANOVA tillsammans med fyra grupper (A B C D) måste oss utföra nästa sex jämförelser.
- a – b
- a – c
- a – d
- b – c
- b – d
- c – d
vårt experiment omfattar denna släkt från sex jämförelser. varenda jämförelse representerar ett tärningsrulle till för att ett fåtal ett falsk positiv. vad existerar felfrekvensen på grund av sex jämförelser? Tyvärr, liksom ni ser härnäst, den experimentella felfrekvensen snöklumpar baserat vid antalet grupper inom experimentet.
den experimentella felfrekvensen blir snabbt problematisk!,
tabellen nedan visar hur en ökat antal grupper inom din undersökning orsakar för att antalet jämförelser ökar, vilket inom sin tur ökar den familjevisa felfrekvensen. Lägg symbol mot hur snabbt kvantiteten jämförelser ökar genom för att lägga mot några grupper! vid motsvarande sätt blir den experimentella felfrekvensen snabbt problematisk.
tabellen börjar tillsammans numeriskt värde grupper, samt den enda jämförelsen mellan dem besitter enstaka försöksmässig felfrekvens liksom motsvarar signifikansnivån (0,05). Tyvärr ökar den familjevisa felfrekvensen snabbt därifrån!,
formeln på grund av detta största antalet jämförelser ni kunna utföra till N-grupper är: (N * (N-1))/2. detta totala antalet jämförelser existerar jämförelsefamiljen på grund av experimentet då man jämför varenda tänkbara par från grupper (dvs. samtliga parvisa jämförelser). Dessutom existerar formeln till kalkyl från felfrekvensen på grund av kurera uppsättningen jämförelser 1 – (1-α)^C. Alpha din signifikansnivå på grund av enstaka enda jämförelse, samt C existerar lika tillsammans med antalet jämförelser.,
den experimentella felfrekvensen representerar sannolikheten till en typ i-fel (falskt positivt) ovan den totala jämförelsefamiljen. Vårt ANOVA-exempel besitter fyra grupper, såsom producerar sex jämförelser samt ett familjevis felfrekvens vid 0,26. angående ni ökar grupperna mot fem hoppar felfrekvensen mot 40%! då ni äger 15 grupper existerar ni nästan garanterad för att äga enstaka falsk positiv (99,5%)!
post Hoc-tester styr den experimentella felfrekvensen
tabellen visar kortfattat detta bekymmer liksom brev hoc-tester löser., Vanligtvis, då ni utför statistisk granskning, förväntar ni dig ett falsk positiv hastighet vid 5%, alternativt vilket värde ni ställer in till signifikansnivån. liksom tabellen visar, då ni ökar antalet grupper ifrån 2 mot 3, tredubblas felfrekvensen nästan ifrån 0,05 mot 0,143. samt detta förvärras snabbt därifrån!
dessa felfrekvenser existerar på grund av höga! då ni ser ett avgörande skillnad mellan grupper, skulle ni äga allvarliga tvivel angående om detta fanns enstaka falsk positiv snarare än ett autentisk skillnad.,
angående ni använder 2-prov T-test till för att systematiskt jämföra varenda gruppmedel inom din undersökning, kommer ni för att stöta vid detta bekymmer. ni skulle ställa in signifikansnivån på grund av varenda test (t.ex. 0,05), samt sedan kommer antalet jämförelser för att avgöra den experimentella felfrekvensen, vilket framträda inom tabellen.
lyckligtvis använder brev hoc-tester en annat tillvägagångssätt. på grund av dessa tester ställer ni in den experimentella felfrekvens ni önskar äga till läka uppsättningen jämförelser. Därefter kalkylerar brev hoc-testet signifikansnivån på grund av varenda enskilda jämförelser såsom ger den familywise-felfrekvens ni anger.,
förstå hur brev hoc-tester fungerar existerar många enklare då ni ser dem inom aktion. Låt oss komma igen mot vårt enkla ANOVA-exempel!
exempel vid för att nyttja Tukeys teknik tillsammans enkelriktad ANOVA
för vårt ANOVA-exempel äger oss fyra grupper liksom kräver sex jämförelser till för att täcka samtliga kombinationer från grupper. oss kommer för att nyttja en brev hoc-test samt ange för att familjen från sex jämförelser kollektivt bör producera enstaka familywise felfrekvens vid 0.05. detta brev hoc-test Jag bör nyttja existerar Tukeys metod., detta finns ett mängd olika brev hoc-tester ni är kapabel välja mellan, dock Tukeys teknik existerar den vanligaste till för att jämföra samtliga tänkbara gruppparningar.
detta finns numeriskt värde sätt för att presentera brev hoc—testresultat-justerade p-värden samt samtidiga konfidensintervall. Jag bör visa dem båda nedan.
justerade p-värden
tabellen nedan visar dem sex olika jämförelserna inom vår undersökning, skillnaden mellan gruppmedel samt detta justerade p-värdet till varenda jämförelse.,
det justerade p-värdet identifierar dem gruppjämförelser liksom skiljer sig avsevärt samtidigt liksom familjefelfrekvensen begränsas mot din signifikansnivå. Jämför bara dem justerade p-värdena mot din signifikansnivå. då justerade p-värden existerar mindre än signifikansnivån existerar skillnaden mellan dessa gruppmedel statistiskt signifikant. Viktigt existerar för att denna process styr den familjevisa felfrekvensen mot din signifikansnivå. oss förmå existera övertygade angående för att kurera denna uppsättning jämförelser kollektivt äger enstaka felfrekvens vid 0,05.,
inom utmatningen ovan existerar endast d – b-skillnaden statistiskt signifikant nära användning från enstaka familjefelfrekvens vid 0,05. Den genomsnittliga skillnaden mellan dessa numeriskt värde grupper existerar 9,5.
samtidiga konfidensintervall
det andra sättet för att presentera brev hoc-testresultat existerar genom för att nyttja samtidiga konfidensintervall till skillnaderna mellan medel. inom en individuellt test överensstämmer hypotesprovresultaten tillsammans enstaka signifikansnivå från α tillsammans konfidensintervall tillsammans med enstaka konfidensnivå vid 1-α. mot modell hypotestester tillsammans enstaka signifikansnivå vid 0.,05 motsvarar 95% konfidensintervall.
inom brev hoc-tester använder oss enstaka samtidig konfidensnivå snarare än enstaka individuell konfidensnivå. Den samtidiga konfidensnivån gäller till bota jämförelsefamiljen. tillsammans enstaka 95% samtidig konfidensnivå förmå oss existera 95% övertygade ifall för att samtliga intervall inom vår uppsättning jämförelser innehåller dem faktiska befolkningsskillnaderna mellan grupper. ett 5% experimentvis felfrekvens motsvarar 95% samtidiga konfidensintervall.
Tukey samtidiga CIs till vår enkelriktad Anova exempel
låt oss anlända mot konfidensintervallen., Medan tabellen ovan visar dessa CIs numeriskt, jag gillar grafen nedan eftersom detta möjliggör ett lätt visuell evaluering, samt detta ger mer upplysning än dem justerade p-värden.
noll indikerar för att gruppmedlen existerar lika. då en konfidensintervall ej innehåller noll existerar skillnaden mellan detta paret statistiskt signifikant. inom diagrammet existerar endast skillnaden mellan D – B signifikant. Dessa CI-resultat matchar hypotesprovresultaten inom föregående tabell., Jag föredrar dessa CI-resultat eftersom dem även ger ytterligare upplysning likt dem justerade p-värdena ej förmedlar.
dessa konfidensintervall ger värden såsom sannolikt innehåller den faktiska befolkningsskillnaden mellan par från grupper. såsom tillsammans med samtliga CIs avslöjar bredden vid intervallet på grund av skillnaden precisionen från uppskattningen. Smalare intervall föreslår enstaka mer precist uppskattning. samt ni förmå värdera angående all intervallet från värden existerar praktiskt taget signifikant., Kom minnas för att statistisk innebörd ej nödvändigtvis indikerar för att resultaten existerar meningsfulla inom den verkliga världen.
när intervallet existerar på grund av brett (otydligt) på grund av för att existera mot hjälp och/eller intervallet innehåller skillnader såsom ej existerar praktiskt signifikanta, äger ni anledning för att tveka innan ni fattar beslut baserat vid resultaten.
brev Hoc-tester samt statistisk strömavbrott
brev hoc-tester existerar god till för att granska den familjevisa felfrekvensen. flera texter skulle avsluta nära denna tidpunkt. ett tradeoff inträffar dock på baksidan kulisserna., ni måste existera medveten angående detta eftersom ni möjligen är kapabel hantera detta effektivt. Tradeoff existerar följande:
post hoc-tester styr den experimentella felfrekvensen genom för att minska jämförelsernas statistiska kraft.
därför på denna plats fungerar detta samt vilket detta betyder till din studie.
för för att erhålla den familjefelfrekvens ni anger måste brev hoc-procedurer Sänka signifikansnivån till varenda enskilda jämförelser. mot modell, till för att avsluta tillsammans ett familjefelfrekvens vid 5% på grund av ett uppsättning jämförelser, använder förfarandet ett ännu lägre individuell signifikansnivå.,
eftersom antalet jämförelser ökar måste brev hoc-analysen sänka den individuella signifikansnivån ytterligare. till våra sex jämförelser använder Tukeys teknik enstaka individuell signifikansnivå vid cirka 0.011 till för att producera den familjevisa felfrekvensen vid 0.05. angående vår ANOVA fordrade fler jämförelser, skulle detta artikel ännu lägre.
vad existerar problemet tillsammans med för att nyttja ett lägre individuell signifikansnivå? Lägre signifikansnivåer motsvarar lägre statistisk effekt., angående ett skillnad mellan gruppmedel faktiskt existerar inom befolkningen, existerar ett undersökning tillsammans lägre konsekvens mindre sannolikt för att upptäcka den. ni förmå missa viktiga resultat!
att undvika denna effektminskning existerar därför flera studier använder ett individuell signifikansnivå vid 0,05 snarare än 0,01. Tyvärr, tillsammans med bara fyra grupper, tvingas vårt modell brev hoc-test för att nyttja den lägre signifikansnivån.
Key Takeaway: ju fler gruppjämförelser ni utför, desto lägre existerar den statistiska kraften inom dessa jämförelser.,
relaterat inlägg: förstå statistisk effekt
hantera strömavbrott inom brev Hoc-tester genom för att minska antalet jämförelser
en teknik på grund av för att mildra denna avvägning existerar genom för att minska antalet jämförelser. Denna minskning fullfölja detta möjligt på grund av proceduren för att nyttja enstaka större individuell felfrekvens på grund av för att att nå ett mål eller resultat den familjefelfrekvens såsom ni anger – vilket ökar den statistiska effekten.
inom den denna plats artikeln besitter jag skrivit ifall för att utföra samtliga parvisa jämförelser—vilket jämför samtliga tänkbara gruppparningar., Även angående detta existerar den vanligaste metoden, antalet kontraster snabbt högar upp! Beroende vid studieens avsikt möjligen ni ej behöver jämföra samtliga tänkbara grupper.
din lärande förmå behöva jämföra endast ett delmängd från varenda tänkbara jämförelser från olika skäl. Jag täcker numeriskt värde vanliga skäl samt visar vilka brev hoc-tester ni är kapabel nyttja. inom nästa modell visar jag bara konfidensintervallgraferna samt ej hypotesprovresultaten. Lägg symbol mot hur dessa andra metoder fullfölja färre jämförelser (3 samt 4) på grund av vårt modell dataset än Tukey teknik (6).,
När ni utformar din undersökning existerar detta viktigt för att ni inom förväg definierar den teknik på grund av flera jämförelser likt ni bör nyttja. Försök ej olika metoder, samt välj sedan den likt ger dem maximalt gynnsamma resultaten. detta existerar uppgifter muddring, samt detta är kapabel leda mot falska fynd. Jag använder flera brev hoc-tester vid enstaka enda datauppsättning till för att visa hur dem skiljer sig, dock detta existerar ej ett lämplig övning till enstaka sann forskning. Definiera din metodik inom förväg, inklusive ett brev hoc-analys, innan ni utvärderar uppgifter samt håll dig mot det!,
Key Takeaway: då detta existerar möjligt, jämföra ett delmängd från grupper på grund av för att öka din statistiska makt.
exempel vid för att nyttja Dunnetts teknik till för att jämföra behandlingsgrupper tillsammans ett kontrollgrupp
om din forskning besitter enstaka kontrollgrupp samt flera behandlingsgrupper kunna ni behöva jämföra behandlingsgrupperna endast tillsammans kontrollgruppen.
använd Dunnetts teknik då nästa existerar sant:
- innan studien vet ni vilken samling (kontroll) ni önskar jämföra tillsammans varenda andra grupper (behandlingar).
- du behöver ej jämföra behandlingsgrupperna tillsammans varandra.,
Låt oss nyttja Dunnetts teknik tillsammans med vårt modell One-way ANOVA, dock oss tweak scenariot något. Antag för att oss på grund av närvarande använder ämne A. oss utförde detta experiment på grund av för att jämföra dem alternativa materialen (B, C samt D) tillsammans med den. ämne A kommer för att existera vår kontrollgrupp, medan dem andra tre existerar behandlingarna.
med Dunnetts teknik ser oss för att endast b – a-skillnaden existerar statistiskt signifikant eftersom intervallet ej inkluderar noll. tillsammans hjälp från Tukeys teknik plats denna jämförelse ej signifikant., Den extra kraft vilket uppnåddes genom för att utföra färre jämförelser kom igenom till oss. Å andra sidan, mot skillnad ifrån Tukeys teknik, finner Dunnetts teknik ej för att d-B-skillnaden existerar signifikant eftersom den ej jämför behandlingsgrupperna tillsammans med varandra.
exempel vid för att nyttja Hsu: s MCB på grund av för att hitta detta starkaste materialet
om Studiens syfte existerar för att känna igen den bästa gruppen möjligen ni ej behöver jämföra varenda tänkbara grupper. Hsu: s multipla jämförelser tillsammans med detta bästa (MCB) identifierar dem grupper liksom existerar bäst, obetydligt olik än dem bästa samt skiljer sig något som är viktigt eller nödvändigt ifrån dem bästa.,
använd Hsu: s MCB då du:
- vet ej inom förväg vilken team ni önskar jämföra tillsammans varenda andra grupper.
- behöver ej jämföra grupper likt ej existerar bäst till andra grupper vilket ej existerar bäst.
- kunna definiera ”det bästa” likt antingen gruppen tillsammans med detta högsta medelvärdet alternativt detta lägsta medelvärdet.
Hsu: s MCB jämför varenda lag tillsammans gruppen tillsammans detta bästa medelvärdet (högsta alternativt lägsta). tillsammans den denna plats proceduren kunna ni avsluta tillsammans flera grupper såsom ej skiljer sig något som är viktigt eller nödvändigt ifrån den bästa gruppen., Tänk vid för att den samling liksom verkligen existerar bäst inom kurera befolkningen möjligen ej äger detta bästa provet betyder vid bas från provtagningsfel. dem grupper såsom ej skiljer sig något som är viktigt eller nödvändigt ifrån den bästa gruppen är kapabel existera lika god likt, alternativt ännu förbättrad än, gruppen tillsammans detta bästa provet betyder.
samtidiga konfidensintervall på grund av Hsu: s MCB
för vår envägsanova önskar oss nyttja materialet vilket producerar dem starkaste delarna. Följaktligen använder oss Hsu: s MCB samt definierar detta högsta medelvärdet såsom detta bästa. oss bryr oss ej ifall varenda andra tänkbara jämförelser.,
Grupp D existerar den bästa gruppen totalt eftersom den besitter detta högsta medelvärdet (41.07). Förfarandet jämförs tillsammans varenda övriga grupper. på grund av Hsu: s MCB existerar enstaka lag betydligt förbättrad än ett ytterligare assemblage då konfidensintervallet äger noll liksom ett slutpunkt. ifrån grafen kunna oss titta för att ämne D existerar betydligt förbättrad än B samt C. A-D-jämförelsen innehåller emellertid noll, vilket indikerar för att A ej skiljer sig något som är viktigt eller nödvändigt ifrån detta bästa.
Hsu: s MCB fastställer för att kandidaterna mot den bästa gruppen existerar A samt D., D besitter detta högsta provet medelvärdet samt A skiljer sig ej signifikant ifrån D. å andra sidan utesluter förfarandet effektivt B samt C ifrån för att artikel bäst.
Recap of Using Multiple Comparison Methods
inom detta denna plats blogginlägget besitter ni sett hur omnibus ANOVA-testet avgör ifall medel existerar olika inom allmänhet, dock detta identifierar ej specifika gruppskillnader vilket existerar statistiskt signifikanta.
ifall ni får avgörande ANOVA-resultat, Använd en brev hoc-test till för att undersöka dem genomsnittliga skillnaderna mellan par från grupper.,
Du äger även lärt dig hur övervakning från den experimentella felfrekvensen existerar enstaka betydelsefull funktion på grund av dessa brev hoc-tester. Dessa familjefelhastigheter växer inom ett överraskande takt!
slutligen, ifall ni ej behöver utföra samtliga parvisa jämförelser, existerar detta värt för att jämföra endast enstaka delmängd eftersom ni behåller mer statistisk kraft.
om ni lär dig ifall hypotesprovning samt gillar detta tillvägagångssätt Jag använder inom min blogg, kolla in min eBook!