본문 바로가기
Statistics/Knowledge

결정계수 (R-squared)

by Mesut Özil 2024. 2. 8.

결정계수 (Coefficient of Determination, R-squared)

회귀분석에서 종속 변수 변동량 설명하는 지표로 사용
0에서 1 사이을 가지며, 1가까울수록 회귀 모형 종속 변수의 변동량 잘 설명한다는 것을 의미
결정계수는 종속 변수와 독립 변수 간의 선형 관계의 강도 측정하는 데 사용
이러한 통계적 개념을 통해 데이터에 숨겨진 패턴을 발견하고 추론할 수 있습니다.

 

결정계수를 구하는 이유

모델의 적합도 평가

결정계수는 회귀 모델이 주어진 데이터를 얼마나 잘 설명하는지를 나타내므로, 모델의 적합도를 평가하는 데 사용

 

변수의 중요도 비교

여러 변수가 있는 경우, 각 변수의 중요도를 비교할 수 있습니다.

결정계수가 높은 변수는 종속 변수를 예측하는 데 더 많은 설명력을 가지고 있다고 볼 수 있습니다.

 

모델 선택

여러 모델을 비교할 때, 결정계수를 사용하여 어떤 모델이 더 나은 예측을 하는지를 평가할 수 있습니다.

 

결정계수 사용 용도

모델 평가

결정계수는 회귀 모델의 적합도를 평가하고 비교하는 데 사용

다른 모델들 간의 상대적인 우수성을 평가하는 데 도움이 됩니다.

 

예측의 신뢰도

높은 결정계수는 모델이 주어진 데이터에 대해 얼마나 잘 예측하는지를 나타내므로,

모델의 예측이 얼마나 신뢰할 수 있는지를 파악하는 데 도움이 됩니다.

 

변수의 중요도 판단

다중 회귀 분석에서는 각 설명 변수의 중요도를 평가하기 위해 결정계수를 사용
결정계수는 간단하면서도 강력한 통계적 측정 지표 중 하나이며, 회귀 분석에서 널리 사용되는 지표 중 하나

 

 

그러나 결정계수는 모델의 복잡성과 관련된 제한 사항이 있을 수 있으며,

이를 보완하기 위해 조정된 결정계수(adjusted R-squared)와 같은 보정된 지표도 함께 사용될 수 있습니다.

 

 

 

본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.

 

'Statistics > Knowledge' 카테고리의 다른 글

상관계수 (Correlation Coefficient)  (0) 2024.02.07
공분산 (Covariance)  (0) 2024.02.06