공분산 (Covariance)
두 변수 간의 관계를 나타내는 통계적 측도로,
두 변수가 함께 어떻게 변하는지를 보여줍니다. 공분산은 양수, 음수, 0일 수 있습니다.
- 공분산 = 양수: 두 변수가 함께 증가or감소하는 경향
- 공분산 = 음수: 한 변수가 증가할 때 다른 변수는 감소하는 경향
- 공분산 = 0: 두 변수가 선형 관계가 없음을 의미
- 공분산의 크기가 클수록 두 변수 간의 관계가 강하다고 해석 가능
공식
이 공식은 각 데이터 포인트에서 각 변수의 평균을 빼고,
그 결과를 곱한 후 모두 합하여 데이터 포인트 수로 나눈 것
여기서 n−1로 나누는 것은 표본이 모집단을 대표하기 위한 것이며, 편향 보정을 위해 사용
또한, 두 변수 X와 Y가 동일한 데이터셋에서 완전히 독립적이라면 공분산은 0
하지만 공분산이 0이라고 → 두 변수가 항상 독립적이라는 것은 X
독립성과 공분산 0은 다르므로 주의해야 합니다.
본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.
'Statistics > Knowledge' 카테고리의 다른 글
결정계수 (R-squared) (2) | 2024.02.08 |
---|---|
상관계수 (Correlation Coefficient) (0) | 2024.02.07 |