회귀 분석이란 무엇이며 어떻게 정의됩니까?
심리학. 상위 정의 스타트 / / September 28, 2023
심리학 박사
회귀 분석은 아마도 두 변수 사이의 관계를 결정하기 위해 가장 널리 사용되는 다변량 통계 기법일 것입니다. 독립변수와 종속변수로 구성된 하나 또는 그룹 두번째-
거의 선천적으로 인간은 자연적으로 일어나는 사건에 대해 설명하려고 노력합니다. 일상 생활, "그 사람은 스트레스를 받기 때문에 담배를 피운다", "과식하면 체중이 늘어난다"; 그러나 우리는 그러한 사건에 대해 우리가 제공하는 설명이 항상 정확하지는 않다는 것을 알고 있습니다. Daniel Kahneman은 자신의 저서 "Thinking Fast, Thinking Slow"에서 사람들이 자신이 사용하는 모든 인지적 요소를 활용하는 경향이 있음에도 불구하고 어떻게 설명하는지 설명합니다. 그들은 어떤 사건을 설명하려고 할 때 항상 실수를 하게 되는데, 이는 여러 요인이 공존하는 현실에서 완전히 정상적인 현상입니다. 반. 그렇다면 사건을 가능한 한 정확하게 설명하려면 어떻게 해야 할까요? 사회과학 및 보건과학에서는 데이터 분석을 통해 이를 수행하는 것이 가능합니다. 통계적 기법의 도움을 받는 일련의 절차로 정의됩니다. 경험적 데이터 샘플에서 정보를 추출하고 개발하기 위해 설명적이고 추론적입니다. 결론. 데이터 분석 내에서 사건에 대해 신뢰할 수 있는 설명을 제공할 수 있는 기술은 회귀 분석이라는 다변량 기술입니다.
회귀분석에는 선형회귀분석, 다중회귀분석, 로지스틱 회귀, 매개 분석, 조정 분석 및 구조 방정식 모델까지 고려할 수 있습니다. (SEM). 그러나 이러한 모든 변형은 예측자, 독립 변수, 변수로 알려진 하나 이상의 입력 변수인 동일한 연산 논리를 따릅니다. 설명 또는 선행 변수는 출력 변수의 가능한 최대 분산량을 예측합니다. 이는 종속 변수 또는 간단히 알 수 있습니다. 표준; 독립 변수가 두 개 이상인 경우 회귀 분석에서는 이들 중 어느 것이 종속 변수에 가장 큰 영향을 미치는지도 결정합니다.
이러한 관계가 어떻게 발생하는지 이해하려면 간단한 선형 회귀 모델을 나타내는 다음 방정식을 사용해야 합니다.
와이 = B어느 하나 +B에야디야 엑스 그리고
어디,
비어느 하나 = 경사의 원점
비에야디야 = 선의 기울기 정도(기울기)
X = VI 값
e = 잔차(오류)
간단히 말해서, 이 방정식은 예측변수(독립변수)의 존재가 기준(종속변수)에 변화를 가져오는 정도를 나타냅니다. 방정식에 잔차(오류)가 언급되어 있지만 모델 내에서 추정되지는 않는다는 점을 언급할 필요가 있습니다. 이 기술은 비판받을 수 있지만 그 "진화" 구조 방정식 모델(SEM)은 보상합니다.
방정식이 추정되면 회귀선이라고 하는 다음과 같은 2차원 평면을 사용하여 시각화할 수 있습니다.
회귀선 또는 기울기
출처: 다그니노(2014)
이 그래프는 (점군을 통해) 관련된 변수의 관계를 제시하는 것 외에도 다음과 같은 선을 노출합니다. 는 이 다이어그램에 이름을 부여하고 경험적 데이터가 회귀 값(B 값)에 맞는 정도를 나타냅니다.
B는 기울기 정도를 알려주지만 실제로는 해석에 별로 유용하지 않습니다. 변수와 동일한 지표로 표현되므로 그 값이 너무 광범위할 수 있습니다. 이와 같이 Z Score를 기준으로 B를 표준화하여 베타계수를 구한다. (β), 그 값은 양수와 음수 모두 0과 1 사이일 수 있으며 다음을 허용합니다. 해석. 따라서 음의 베타 값은 예측 변수가 기준을 부정적으로 예측한다는 것을 나타냅니다. 즉, 예측 변수의 존재가 클수록 기준의 존재 가능성이 낮아집니다. 반대로, 양의 베타는 예측 변수의 존재가 기준의 존재를 선호한다는 것을 나타냅니다.
다른 추론 통계 기법과 마찬가지로 회귀 분석의 해석은 다음 사항에 따라 달라집니다. 가설 대조 또는 사회 과학에서 일반적으로 p인 유의성 값(p) > .05.
마지막으로 회귀분석의 기본 개념은 모델이 설명하는 분산을 나타내는 R2 값입니다. 직접 해석하거나 100을 곱하여 분산의 백분율을 얻을 수 있는 회귀 설명했다.
로지스틱 회귀
처음에 언급했듯이 다양한 회귀 분석이 있습니다. 회귀는 이전에 다루었습니다. 단순 선형 및 다중에서는 예측 변수와 기준이 모두 연속적이라고 가정합니다. 그러나 변수가 연속적이지 않은 경우, 즉 범주형인 경우에는 로지스틱 회귀 분석을 사용해야 합니다. 이것이 나머지 회귀 모델과의 유일한 차이점입니다.
참고자료
다그니노, J. 에스. (2014). 선형 회귀. 칠레 마취학 저널, 43, 143-149.헤이즈, F. 에게. (2018). 조정, 조정 및 조건부 프로세스 분석 소개. 회귀 기반 접근 방식. (2번째. 판). 길포드 출판사.