범위
=가장 단순한 변동성있는 척도
=max-min
=가장 단순하지만 극단값의 영향을 많이 받는다
사분위수 범위
=1사분위수와 3사분위수의 차이이다
=극단값의 영향을 줄이기 위함
분산
=모든 자료를 이용하는 변동성의 척도이다
=두개 이상의 변수의 변동성을 비교하는데 유용
표준편차
=분산의 양의 제곱근으로 정의
변이계수
=어떤 경우에는 표준편차가 평균과 비해 얼마나 큰가를 비교하는데 관심있는 경우
=표준편차와 평균이 다른 변수와 변동성을 비교할때 유용하게 사용
=(표준편차/평균)*100

왜도
-분포의 모양을 측정한다.
-음수인 경우 왼쪽으로 치우쳐짐(avg는 median보다 작다.)
-양수인 경우 오른쪽으로 치우쳐짐
왜도가 0이면 대칭
z-score
-자료가 자료집합내에서 어느정도 위치인지 알고 싶은 경우
박스플롯
-5개의 숫자요약에 기초한 자료의 그래프(최솟값, 1사분위수, 중앙값 , 3사분위수 , 최댓값)
공분산
-두 변수의 선형관계를 보여줌


'3-1 > 3학년 1학기 빅데이터분석 (CS1304 - 01)' 카테고리의 다른 글
| sol 3 (0) | 2023.03.29 |
|---|---|
| chapter02 sol (0) | 2023.03.26 |
| 3월20일 수업 (0) | 2023.03.20 |
| chapter01 sol (0) | 2023.03.19 |
| 3월 15일 수업 (0) | 2023.03.16 |