본문 바로가기

일상/비즈

상관계수

(1) -1 ~ 1 이므로 -1 또는 1에 가까워질수록 직선적이 되어 관련이 많다는 것을 의미
(2) 계수가 마이너스인 경우, 수치 데이터가 증가하면 다른 수치 데이터는 감소하는 관계
(3) 플러스인 경우, 수치 데이터가 증가하면 다른 수치 데이터도 증가하는 관계
(4) 상관계수만으로 관련성 판별
     0.0 ~ 0.2 : 어느 정도 관련성 있다.
     0.2 ~ 0.4 : 관계가 약하다
     0.4 ~ 0.7 : 관계가 있다.
     0.7 ~ 1.0 : 관계가 강하다.
(5) 관련성 유무 판정 : 상관계수*상관계수 > 4 / (데이터수 +2)
     상관계수는 데이터 수가 많아질수록 관련성은 강해도 적어지기 때문
(6) 유의점
     : 두 변수간의 직선관계를 표준화시킨 척도
     : 두 변수가 직선 이외의 곡선이나 원형을 유지해도 상관계수는 0이 되므로 주의
     : 변수 간의 관계는 상관계수와 분산형 차트를 함께 사용하여 판정