결정계수 (Coefficient of Determination, R-squared)
회귀분석에서 종속 변수의 변동량을 설명하는 지표로 사용
0에서 1 사이의 값을 가지며, 1에 가까울수록 회귀 모형이 종속 변수의 변동량을 잘 설명한다는 것을 의미
결정계수는 종속 변수와 독립 변수 간의 선형 관계의 강도를 측정하는 데 사용
이러한 통계적 개념을 통해 데이터에 숨겨진 패턴을 발견하고 추론할 수 있습니다.
결정계수를 구하는 이유
모델의 적합도 평가
결정계수는 회귀 모델이 주어진 데이터를 얼마나 잘 설명하는지를 나타내므로, 모델의 적합도를 평가하는 데 사용
변수의 중요도 비교
여러 변수가 있는 경우, 각 변수의 중요도를 비교할 수 있습니다.
결정계수가 높은 변수는 종속 변수를 예측하는 데 더 많은 설명력을 가지고 있다고 볼 수 있습니다.
모델 선택
여러 모델을 비교할 때, 결정계수를 사용하여 어떤 모델이 더 나은 예측을 하는지를 평가할 수 있습니다.
결정계수 사용 용도
모델 평가
결정계수는 회귀 모델의 적합도를 평가하고 비교하는 데 사용
다른 모델들 간의 상대적인 우수성을 평가하는 데 도움이 됩니다.
예측의 신뢰도
높은 결정계수는 모델이 주어진 데이터에 대해 얼마나 잘 예측하는지를 나타내므로,
모델의 예측이 얼마나 신뢰할 수 있는지를 파악하는 데 도움이 됩니다.
변수의 중요도 판단
다중 회귀 분석에서는 각 설명 변수의 중요도를 평가하기 위해 결정계수를 사용
결정계수는 간단하면서도 강력한 통계적 측정 지표 중 하나이며, 회귀 분석에서 널리 사용되는 지표 중 하나
그러나 결정계수는 모델의 복잡성과 관련된 제한 사항이 있을 수 있으며,
이를 보완하기 위해 조정된 결정계수(adjusted R-squared)와 같은 보정된 지표도 함께 사용될 수 있습니다.
본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.
'Statistics > Knowledge' 카테고리의 다른 글
상관계수 (Correlation Coefficient) (0) | 2024.02.07 |
---|---|
공분산 (Covariance) (0) | 2024.02.06 |