Hvad er regressionsanalyse, og hvordan defineres det?
Psykologi. Top Definitioner Start / / September 28, 2023
Doktor i psykologi
Regressionsanalyse er muligvis den mest udbredte multivariate statistiske teknik til at bestemme sammenhængen mellem en eller en gruppe af uafhængige variable og en afhængig sådan, at førstnævnte kan forudsige ændringen i anden-
Næsten medfødt forsøger mennesker at give forklaringer på de begivenheder, der sker naturligt. hverdagen, "den person ryger, fordi de føler sig stresset", "overspisning fører til større kropsvægt"; Vi ved dog, at de forklaringer, vi giver til sådanne begivenheder, ikke altid er korrekte. Daniel Kahneman beskriver i sin bog "Thinking Fast, Thinking Slow" hvordan, selvom folk har en tendens til at gøre brug af alle de kognitive elementer, de besidder, vil de altid begå fejl, når de forsøger at forklare en eller anden begivenhed, hvilket er helt normalt i en virkelighed, hvor flere faktorer eksisterer side om side. halvt. Så hvordan kunne vi forsøge at forklare begivenheder så præcist som muligt? I samfunds- og sundhedsvidenskaben er det muligt at gøre dette gennem dataanalyse; som er defineret som et sæt procedurer, der er hjulpet af statistiske teknikker beskrivende og inferentielle for at udtrække information fra en empirisk stikprøve af data og udvikle konklusioner. Inden for dataanalyse er teknikken, der vil tillade os at give pålidelige forklaringer på hændelser, en multivariat teknik kaldet regressionsanalyse.
Regressionsanalyse har en række varianter såsom lineær regressionsanalyse, multipel regressionsanalyse, logistisk regression, mediationsanalyse, moderationsanalyse og endda strukturelle ligningsmodeller kunne overvejes (SEM). Men alle disse varianter følger den samme operationelle logik, en eller flere inputvariabler, som kan kendes som prædiktorer, uafhængige variabler, variabler. forklarende eller forudgående variable, forudsige den størst mulige mængde af varians af en outputvariabel, som kan være kendt som den afhængige variabel eller blot kriterium; Når der er mere end én uafhængig variabel, afgør regressionsanalysen også, hvilken af disse der har størst indflydelse på den afhængige variabel.
For at forstå, hvordan disse forhold opstår, må vi ty til følgende ligning, som præsenterer en simpel lineær regressionsmodel:
y = Benten +BYo x og
Hvor,
benten = Oprindelse af hældning
bYo = Linjens hældningsgrad (hældning)
X = VI værdi
e = rester (fejl)
Enkelt sagt angiver denne ligning, i hvilken grad tilstedeværelsen af en prædiktor (uafhængig variabel) frembringer en ændring i kriteriet (afhængig variabel). Det er nødvendigt at nævne, at selvom ligningen nævner den resterende (fejl), er den ikke estimeret inden for modellen, element som denne teknik kan kritiseres for, men at dens "evolution" strukturelle ligningsmodeller (SEM) kompenserer.
Når ligningen er blevet estimeret, kan den visualiseres ved hjælp af følgende todimensionelle plan, kaldet regressionslinjen.
Regressionslinje eller hældning
Kilde: Dagnino (2014)
Denne graf viser, udover at præsentere forholdet mellem de involverede variable (gennem skyen af punkter), en linje, der giver navnet til dette diagram og angiver i hvilken grad de empiriske data passer til regressionsværdien (værdien af B).
Selvom B fortæller os graden af hældningen, er den faktisk ikke særlig brugbar til fortolkning, fordi Det er udtrykt i samme metrik som variablerne, og derfor kan dets værdier være for omfattende. På denne måde opnås beta-koefficienten ved at standardisere B baseret på Z-scorerne (β), hvis værdier kan være mellem 0 og 1, både positiv og negativ, og som tillader dens fortolkning. En negativ betaværdi vil således indikere, at prædiktorvariablen negativt forudsiger kriteriet, det vil sige, jo større tilstedeværelsen af prædiktoren er, jo mindre sandsynlig er tilstedeværelsen af kriteriet; Tværtimod indikerer en positiv beta, at tilstedeværelsen af prædiktoren favoriserer tilstedeværelsen af kriteriet.
Ligesom andre inferentielle statistiske teknikker vil fortolkningen af en regression afhænge af hypotesekontrast, eller signifikansværdien (p), som i samfundsvidenskab typisk er p > .05.
Endelig er et elementært begreb for regressionsanalyse R2-værdien, som refererer til variansen forklaret af modellen. regression, som kan fortolkes direkte eller ved at gange den med 100 for at få procentdelen af varians forklaret.
Logistisk regression
Som nævnt indledningsvis er der forskellige regressionsanalyser; regression blev tidligere behandlet simple lineære og multiple, antager disse, at både prædiktorvariablerne og kriteriet er kontinuerte. Men når variablerne ikke er kontinuerte, dvs. de er kategoriske, skal der anvendes logistisk regressionsanalyse; Dette er den eneste forskel med resten af regressionsmodellerne.
Referencer
Dagnino, J. S. (2014). Lineær regression. Chilensk Journal of Anesthesiology, 43, 143-149.Hayes, F. TIL. (2018). Introduktion til mediation, moderering og betinget procesanalyse. En regressionsbaseret tilgang. (2. udgave). Guilford Press.