Hur räknar man ut förväntat värde
Korrelation samt regressionsanalys
I detta på denna plats avsnittet bör oss titta närmare vid dem båda besläktade begreppen korrelation samt regressionsanalys. tillsammans med hjälp från dessa term förmå oss hitta samband inom serier från observationsvärden, likt oss inom sin tur är kapabel nyttja till för att erhålla enstaka förbättrad medvetande till dem fenomen likt oss undersöker inom olika sammanhang.
Korrelation
Vi bestämmer oss på grund av för att utföra ett rapport var oss den inledande måndagen inom varenda kalendermånad beneath en helt års period beräknar antalet personer vid enstaka tågperrong mellan klockan 9 samt då året existerar slut således sammanställer oss resultaten inom enstaka tabell i enlighet med nedan.
I en spridningsdiagram låter man den en variabeln, kallad den förklarande variabeln, finnas längs x-axeln, samt den andra variabeln, responsvariabeln, finnas längs y-axeln. inom vårt modell existerar vilken tidsperiod detta existerar den förklarande variabeln samt antalet räknade personer vid perrongen responsvariabeln. till varenda tillgängligt värde vid den förklarande variabeln markerar oss in dess motsvarande värde på grund av responsvariabeln (i vårt fall existerar mot modell en från värdena vid den förklarande variabeln "mars" samt motsvarande värde vid responsvariabeln personer). Utifrån denna serie observationsvärden förmå oss sedan undersöka ifall detta finns något samband mellan vilken tidsperiod detta existerar samt antalet personer vilket befunnit sig vid perrongen. Detta fullfölja oss inledningsvis genom för att rita in våra observationsvärden inom en spridningsdiagram.
Markerar oss vid detta sätt varenda par från värden vid den förklarande variabeln samt responsvariabeln inom en spridningsdiagram, sålunda ser detta inom vårt modell ut vid nästa sätt:
Utifrån en spridningsdiagram är kapabel man sedan erhålla ett perception angående om detta finns något samband, alternativt korrelation, mellan den förklarande variabeln samt responsvariabeln.
Om observationsvärdena vilket man äger markerat inom spridningsdiagrammet ligger samlade runt enstaka tänkt linje tillsammans positiv lutning, sålunda säger man för att detta finns enstaka positiv korrelation mellan den förklarande variabeln samt responsvariabeln. Detta existerar fallet på grund av följd liksom markerats inom diagrammet nedan.
Om dem observationsvärden såsom man markerat däremot ligger samlade runt ett tänkt linje tillsammans med enstaka negativ lutning, sålunda kallar man detta enstaka negativ korrelation mellan den förklarande variabeln samt responsvariabeln, vilket oss ser en modell vid inom diagramet nedan.
I en fall vilket vårt modell inom start från avsnittet, var detta varken verkar finnas enstaka positiv alternativt negativ korrelation mellan variablerna, säger man för att korrelation saknas samt oss förmå då dra slutsatsen för att detta utifrån våra observationsvärden ej tycks finnas något samband mellan vilken tidsperiod detta existerar samt hur flera personer såsom befinner sig vid perrongen.
Något likt existerar viktigt för att anlända minnas då oss utför korrelationsundersökningar, existerar för att bara till för att detta finns enstaka korrelation mellan dem variabler oss tittar vid, således behöver detta ej finnas en orsakssamband. tillsammans med detta menar oss för att även ifall detta finns enstaka korrelation mellan variablerna, således förmå detta finnas någon ytterligare variabel såsom ej finns tillsammans med inom vår undersökning, liksom redogör varför våra variabler samvarierar.
Om oss mot modell fullfölja ett studie var oss jämför ålder tillsammans förekomst från enstaka viss sjukdom, sålunda förmå detta existera därför för att detta finns ett kraftfull positiv korrelation mellan hur äldre ett individ existerar samt hur vanligt förekommande sjukdomen existerar. Dock kunna oss ej utan vidare dra slutsatsen för att detta existerar upphöjd ålder liksom orsakat sjukdomen, då detta förmå finnas andra faktorer vilket agerar in, mot modell levnadsvanor, förekomst från andra sjukdomar, kostvanor tidigare inom existensen, etc. Därför bör man artikel försiktig tillsammans för att dra slutsatser angående för att man funnit en orsakssamband, då man egentligen bara är kapabel äga funnit enstaka korrelation mellan dem studerade variablerna.
Regressionsanalys
Vi kunna utifrån en spridningsdiagram var oss ser en linjärt samband (antingen positiv alternativt negativ korrelation) förklara sambandet tillsammans ett linjär modell alternativt tillsammans andra mening förklara sambandet tillsammans med hjälp från räta linjens ekvation vid formen
$$f(x) = kx + m$$
När oss söker efter ett linjär modell såsom beskriver sambandet mellan våra variabler, kallar man detta linjär regression alternativt regressionsanalys. vilket oss söker existerar alltså ett linje såsom våra markerade punkter avviker således lite ifrån vilket möjligt. äger oss en spridningsdiagram således kunna oss på grund av grabb rita in ett sådan ungefärlig linje samt sedan ta reda vid linjens k-värde samt m-värde, vid identisk sätt vilket oss gjort tidigare utifrån kända punkter. Den räta linjens ekvation liksom oss försöker för att anlända fram mot kallas den maximalt anpassade ekvationen samt existerar den linje var avvikelsen ifrån dem markerade punkterna/mätvärdena inom diagrammet existerar därför små likt möjligt.
För för att erhålla fram ett sålunda noggrant linjär anpassning vilket möjligt, använder man sig mot modell från sådana inbyggda funktioner på grund av för att utföra linjär regression såsom finns vid flera grafritande miniräknare.
När man genom regressionsanalys väl besitter funnit ett ekvation vilket således gott detta går beskriver detta statistiska underlag likt man besitter, är kapabel man sedan nyttja denna raka modell mot för att förutse vad man kommer för att ett fåtal till värden nära andra mätpunkter.
Medellängden vid svenska barn
I spridningsdiagrammet nedan besitter oss markerat in medellängden (responsvariabel; längs y-axeln) vid svenska små människor inom åldrarna tid (den förklarande variabeln; längs x-axeln).
Som oss förmå titta sålunda verkar detta finnas ett positiv linjär korrelation mellan åldern samt den genomsnittliga längden. Därför är kapabel oss försöka för att hitta ett linjär modell på grund av sambandet tillsammans hjälp från enstaka linjär regressionsanalys.
Vi börjar tillsammans för att dra enstaka rät linje vilket ligger vid en sådant sätt för att avvikelsen mellan linje samt punkterna blir således små liksom möjligt.
När oss idag besitter ett rät linje markerad inom vårt spridningsdiagram, kunna oss, liksom till vilken ytterligare rät linje vilket helst, studera från koordinaterna till numeriskt värde slumpmässiga punkter längs sträcka. Dessa punkter behöver ej artikel någon från dem punkter likt oss markerat inom diagrammet; punkterna längs linje likt oss läser från får även gärna ligga ner enstaka god bit ifrån varandra längs linje, således för att eventuella avläsningsfel blir mindre betydelsefulla.
I spridningsdiagrammet ovan äger oss markerat dem båda punkterna (4; ,5) samt (15; ).
När oss väl besitter funnit koordinaterna till numeriskt värde punkter längs sträcka, använder oss dessa till för att beräkna lutningen vid vår linje:
$$k=\frac{,5}{}=\frac{69,5}{11}\approx6,3$$
I nästa steg kalkylerar oss räta linjens ekvation inom dess totalitet, tillsammans med hjälp från antingen k-formen alternativt enpunktsformen.
Vi använder oss denna plats från k-formen, sätter in dem kända koordinaterna på grund av enstaka från punkterna längs sträcka samt får ut konstanttermen m:
$$f(x)=kx+m$$
$$=\frac{69,5}{11}\cdot 15+m$$
$$m=\frac{69,5\cdot 15}{11}\approx77$$
När oss för tillfället känner mot värdet vid såväl riktningskoefficienten k likt konstanttermen m, äger oss vår sökta räta linjes ekvation:
$$f(x)=6,3x+77$$
Detta existerar alltså detta raka samband liksom oss besitter funnit mellan ålder, x, samt genomsnittlig längd, y, utifrån vårt statistiska material.
Som oss skrev tidigare således är kapabel man nyttja enstaka linjär regression till för att förutse framtida värden, detta önskar yttra inom vårt modell vilken längd små människor inom allmänhet kommer för att äga nära olika åldrar. oss är kapabel utifrån detta raka sambandet förutse ungefär hur utdragen enstaka åring är:
$$f(13)=6,3\cdot 13+77=,9\,cm$$
En linjär regression, angående analysen äger utförts riktig, stämmer väl inom detta intervall oss undersökt samt ofta även ett bit utanför detta, dock ju längre försvunnen ifrån detta intervall oss fått den raka regressionen ifrån, desto sämre fungerar ofta modellen. Skulle oss nyttja vår raka modell ovan till för att ta reda vid hur utdragen ett åring existerar, således får oss detta till
$$f(50)=6,3\cdot 50+77=\,cm$$
En åring från normallängd skulle i enlighet med den denna plats modellen alltså artikel ca 3,92 meter utdragen, vilket visar vid för att modellen ej existerar tillämpbar vid vuxna människor (eftersom människor normalt slutar för att växa vid längden inom årsåldern).
Det existerar även troligt för att vår raka modell existerar dålig vid för att förutse riktigt unga barns längd, mot modell då barnet existerar nyfött, detta önskar yttra 0 kalenderår gammalt (vilket oss även är kapabel ana oss mot ifall oss tittar inom spridningsdiagrammet på grund av åldern 1 år). i enlighet med vår modell bör en 0 kalenderår gammalt små människor äga ett längd vid 77 cm, dock inom själva verket existerar genomsnittslängden på grund av nyfödda små människor ca 50 cm.
Vi avslutar tillsammans med för att visa inom en modell hur oss är kapabel låta GeoGebra producera ett linjär modell ovan sambandet åt oss.
Ett konditori sålde semlor beneath åtta veckor mellan januari samt mars samt förde statistik ovan hur priset vid semlor påverkade försäljningen. Tabellen nedan visar resultatet.
Priset per semla (kr) | Antal avyttrade semlor |
36 | |
64 | |
72 | |
45 | |
54 | |
42 | |
39 | |
60 |
Anpassa enstaka rät linje mot mätpunkterna, ange linjens ekvation samt vilken sorts korrelation sambandet visar.
Lösning:
Vi börjar tillsammans för att öppna GeoGebra, oss kommer denna gång nyttja Geogebra classic samt öppna en kalkylblad samt föra in värdena inom tabellen således här.
Sedan markerar oss varenda våra värden samt klickar vid stapeldiagrammet längst bort upp samt väljer Tvåvariabels regressionsanalys liksom oss förmå titta inom bilden nedan.
Då får oss upp en spridningsdiagram såsom ser ut likt följande:
För för att producera vår raka modell, således väljer oss Linjär inom rullgardinsmenyn
Då skapas vår linje inom spridningsdiagrammet direkt samt längs ner är kapabel oss studera från linjens ekvation.
Så svaret blir alltså för att linjens ekvation mot vår raka modell existerar ungefär (avrundat mot heltal) \(f(x) = x + \) samt oss förmå titta för att sambandet motsvarar enstaka negativ korrelation.
Sammanfattning
Korrelation beskriver samband, både inom styrka samt riktning
Regressionsanalys existerar för att oss försöker beskriva sambandet tillsammans enstaka linjär modell tillsammans hjälp från räta linjens ekvation vid formen \(f(x) = kx + m \)