chapter12
시계열데이터
-시간의 경과에 따라 순서대로 관측되는 관측값의 계열
-시간에 따라 관측되는 관계로 대개 독립적이 아니다.
-분석목적은 시계열자료가 생성되는 확률과정을 모형화시켜 그 과정을 이해하는 것
-적절한 모형을 이용하여 미래에 관측될 수 있는 값을 예측하는 것
-과거의 자료를 바탕으로 미래의 값을 예측
시계열 그림
-시간의 경과에 따라 시계열이 변하는 것을 그린 그림 , 시간 t를 가로축, 시계열의 관측값 Zt를 세로축으로하여 그린다.
-그림을 통하여 시계열이 가지는 특징을 한눈에 볼 수 있다.
시계열 변동의 종류
-확률변수(random variation)
-계통변동(systematic variation)
계통변동
-우연변동(chance variation):시간과 관계없이 랜덤한 원인에 의해 나타나는 변동을 의미
-추세변동(trend variation):시간이 경과함에 따라 관측값이 지속적으로 변화하는 형태, 반드시 직선은 아니다.
-계절변동(seasonal variation):계절에 따라 변화하는것.
지수(index numbers)
-시간이 경과함에 따라 발생하는 많은 자료를 요약하여 변화를 쉽게 보여 주기 위해 계산하는것
-사전에 지정된 기준시의 시계열의 값을 기준으로 하여 다른 시점에서의 시계열의 값을 기준시의 값에 대한 비율로 나타낸것으로 보통 백분율로 나타냄
단순지수(simple index numbers)
-단일상품의 가격이나 수량의 변화를 근거로 하여 계산되는 지수
->계산법
-특정기간동안의 상품의 가격이나 수량을 기록후 기준시(base period)를 정한다.
-각 시점의 단순지수 구하기. t시점의 지수=(t시점의 시계열의 값/기준시의 시계열의 값)*100
복합지수(composite index numbers)
-여러개의 상품의 가격이나 수량의 변화를 근거로 하여 계산되는 지수
예측
질적인 방법
-주관적 판단
-과거의 정보가 어떻게 이용되었는 지 몰라서 다른 사람에 의해 재현될수 없으며 주로 개인의 경험에 의해 결정
양적인 방법
-모형을 이용한다.(이동평균법, 지수평활법, 다항추세모델 , 자가회귀누적이동평균모형 등)
평활법:불규칙한 변동을 제거하여 전반적인 추세를 뚜렷하게 파악할 수 있도록하여 예측을 쉽게 할 수 있도록 해주는 방법
이동평균법(moving average method)
-이동평균: N개의 인접한 관측값들의 평균
-이동평균값을 이용하여 시계열을 그린다. -> 기존에 비하여 변화하는 정도가 급격하기 않아 시계열의 장기추세를 쉽게 알 수 있다. ->이동평균값을 예측값으로 이용한다는 것을 의미
if) 우연변동만 평활하고자 한다면 -->N값을 작게
if) 계절변동만 평활하고자 한다면 -->N값을 계절의 주기와 같게
N값이 작아지면 평활되는 정도 감소 , 자료 손실 감소
N값이 커진다면 평활되는 정도 증가 , 자료 손실 증가 -->추세 파악 쉽다.
-단점:이동평균을 이용하여 평활을 구할시 미래의 값을 필요로 하므로 예측의 목적으로는 적합x, 이 문제는 과거의 값만 가지고 계산할 수 있으나 이러면 처음 N개의 자료를 잃어버려서 정보의 손실을 가져온다.
지수평활법(exponential smothing method)
-최근의 자료에 가중치를 주는 방법이다. -->0과1사이의 값을 가지는 지수평활계수w를 선택해야한다.
계산-> St= wZt + (1-w)S(t-1)-->St는 현재 관측값에 가중치 w를 두고 그 전의 지수평활값에 가중값(1-w)주서서 계산한다.
ex)S1=Z1, S2= wZ2 + (1-w)S1 , S3 = wZ3 + (1-w)S2 ..........
-w의 선택이 중요 --> 크면 최근값에 가중치를 더 주며 평활되는 정도가 작다.