Hva er regresjonsanalyse, og hvordan defineres den?
Psykologi. Topp Definisjoner Start / / September 28, 2023
Doktor i psykologi
Regresjonsanalyse er muligens den mest brukte multivariate statistiske teknikken for å bestemme sammenhengen mellom en, eller en gruppe, av uavhengige variabler og en avhengig slik at førstnevnte kan forutsi endringen i sekund-
Nesten medfødt prøver mennesker å gi forklaringer på hendelsene som skjer naturlig. hverdagen, «den personen røyker fordi de føler seg stresset», «overspising fører til større kroppsvekt»; Vi vet imidlertid at forklaringene vi gir til slike hendelser ikke alltid er riktige. Daniel Kahneman beskriver i sin bok "Thinking Fast, Thinking Slow" hvordan, selv om folk har en tendens til å bruke alle de kognitive elementene de besitter, vil de alltid gjøre feil når de prøver å forklare en hendelse, noe som er helt normalt i en virkelighet der flere faktorer eksisterer side om side. halv. Så hvordan kan vi prøve å forklare hendelser så nøyaktig som mulig? I samfunns- og helsefag er det mulig å gjøre dette gjennom dataanalyse; som er definert som et sett med prosedyrer som er hjulpet av statistiske teknikker beskrivende og inferensiell for å trekke ut informasjon fra et empirisk utvalg av data og utvikle konklusjoner. Innen dataanalyse er teknikken som vil tillate oss å gi pålitelige forklaringer på hendelser en multivariat teknikk kalt regresjonsanalyse.
Regresjonsanalyse har en rekke varianter som lineær regresjonsanalyse, multippel regresjonsanalyse, logistisk regresjon, medieringsanalyse, moderasjonsanalyse og til og med strukturelle ligningsmodeller kan vurderes (SEM). Imidlertid følger alle disse variantene den samme operasjonelle logikken, en eller flere inngangsvariabler, som kan bli kjent som prediktorer, uavhengige variabler, variabler. forklarende eller forutgående variabler, forutsi størst mulig varians av en utdatavariabel, som kan være kjent som den avhengige variabelen eller ganske enkelt kriterium; Når det er mer enn én uavhengig variabel, avgjør regresjonsanalysen også hvilken av disse som har størst innflytelse på den avhengige variabelen.
For å forstå hvordan disse relasjonene oppstår, må vi ty til følgende ligning, som presenterer en enkel lineær regresjonsmodell:
y = Benten +BYo x og
Hvor,
benten = Opprinnelse til skråning
bYo = Hellingsgrad av linjen (helling)
X = VI-verdi
e = Rester (feil)
Enkelt sagt indikerer denne ligningen i hvilken grad tilstedeværelsen av en prediktor (uavhengig variabel) produserer en endring i kriteriet (avhengig variabel). Det er nødvendig å nevne at selv om ligningen nevner gjenværende (feil), er den ikke estimert innenfor modellen, element som denne teknikken kan kritiseres for, men at dens "evolusjon" strukturelle ligningsmodeller (SEM) kompenserer.
Når ligningen er estimert, kan den visualiseres ved hjelp av følgende todimensjonale plan, kalt regresjonslinjen.
Regresjonslinje eller skråning
Kilde: Dagnino (2014)
Denne grafen, i tillegg til å presentere forholdet mellom de involverte variablene (gjennom poengskyen), viser en linje som gir navnet til dette diagrammet og angir i hvilken grad de empiriske dataene passer til regresjonsverdien (verdien av B).
Selv om B forteller oss graden av helningen, er det faktisk lite nyttig for tolkning fordi Det er uttrykt i samme metrikk som variablene, og derfor kan verdiene være for omfattende. På denne måten, ved å standardisere B basert på Z-skårene, oppnås beta-koeffisienten (β), hvis verdier kan være mellom 0 og 1, både positive og negative og som tillater sin tolkning. Dermed vil en negativ betaverdi indikere at prediktorvariabelen negativt predikerer kriteriet, det vil si at jo større tilstedeværelsen av prediktoren er, jo mindre sannsynlig er tilstedeværelsen av kriteriet; Tvert imot, en positiv beta indikerer at tilstedeværelsen av prediktoren favoriserer tilstedeværelsen av kriteriet.
Som andre inferensielle statistiske teknikker, vil tolkningen av en regresjon avhenge av hypotesekontrast, eller signifikansverdien (p), som i samfunnsvitenskap typisk er p > .05.
Til slutt, et elementært konsept for regresjonsanalyse er R2-verdien, som refererer til variansen som forklares av modellen. regresjon, som kan tolkes direkte eller ved å multiplisere den med 100 for å få prosenten av variansen forklart.
Logistisk regresjon
Som nevnt innledningsvis er det ulike regresjonsanalyser, regresjon ble tidligere tatt opp enkel lineær og multiplum, disse antar at både prediktorvariablene og kriteriet er kontinuerlige. Men når variablene ikke er kontinuerlige, det vil si at de er kategoriske, må logistisk regresjonsanalyse benyttes; Dette er den eneste forskjellen med resten av regresjonsmodellene.
Referanser
Dagnino, J. S. (2014). Lineær regresjon. Chilean Journal of Anesthesiology, 43, 143-149.Hayes, F. TIL. (2018). Introduksjon til mekling, moderering og betinget prosessanalyse. En regresjonsbasert tilnærming. (2. utgave). Guilford Press.