3-1/3학년 1학기 빅데이터분석 (CS1304 - 01)
3월22일 수업
정지홍
2023. 3. 22. 22:09
범위
=가장 단순한 변동성있는 척도
=max-min
=가장 단순하지만 극단값의 영향을 많이 받는다
사분위수 범위
=1사분위수와 3사분위수의 차이이다
=극단값의 영향을 줄이기 위함
분산
=모든 자료를 이용하는 변동성의 척도이다
=두개 이상의 변수의 변동성을 비교하는데 유용
표준편차
=분산의 양의 제곱근으로 정의
변이계수
=어떤 경우에는 표준편차가 평균과 비해 얼마나 큰가를 비교하는데 관심있는 경우
=표준편차와 평균이 다른 변수와 변동성을 비교할때 유용하게 사용
=(표준편차/평균)*100

왜도
-분포의 모양을 측정한다.
-음수인 경우 왼쪽으로 치우쳐짐(avg는 median보다 작다.)
-양수인 경우 오른쪽으로 치우쳐짐
왜도가 0이면 대칭
z-score
-자료가 자료집합내에서 어느정도 위치인지 알고 싶은 경우
박스플롯
-5개의 숫자요약에 기초한 자료의 그래프(최솟값, 1사분위수, 중앙값 , 3사분위수 , 최댓값)
공분산
-두 변수의 선형관계를 보여줌

