chapter12

책/통계학개론(22.12.27-23.01.02)(영지문화사)

chapter12

정지홍 2023. 1. 2. 12:08

시계열데이터

-시간의 경과에 따라 순서대로 관측되는 관측값의 계열

-시간에 따라 관측되는 관계로 대개 독립적이 아니다.

-분석목적은 시계열자료가 생성되는 확률과정을 모형화시켜 그 과정을 이해하는 것

-적절한 모형을 이용하여 미래에 관측될 수 있는 값을 예측하는 것

-과거의 자료를 바탕으로 미래의 값을 예측

시계열 그림

-시간의 경과에 따라 시계열이 변하는 것을 그린 그림 , 시간 t를 가로축, 시계열의 관측값 Zt를 세로축으로하여 그린다.

-그림을 통하여 시계열이 가지는 특징을 한눈에 볼 수 있다.

시계열 변동의 종류

-확률변수(random variation)

-계통변동(systematic variation)

계통변동

-우연변동(chance variation):시간과 관계없이 랜덤한 원인에 의해 나타나는 변동을 의미

-추세변동(trend variation):시간이 경과함에 따라 관측값이 지속적으로 변화하는 형태, 반드시 직선은 아니다.

-계절변동(seasonal variation):계절에 따라 변화하는것.

지수(index numbers)

-시간이 경과함에 따라 발생하는 많은 자료를 요약하여 변화를 쉽게 보여 주기 위해 계산하는것

-사전에 지정된 기준시의 시계열의 값을 기준으로 하여 다른 시점에서의 시계열의 값을 기준시의 값에 대한 비율로 나타낸것으로 보통 백분율로 나타냄

단순지수(simple index numbers)

-단일상품의 가격이나 수량의 변화를 근거로 하여 계산되는 지수

->계산법

-특정기간동안의 상품의 가격이나 수량을 기록후 기준시(base period)를 정한다.

-각 시점의 단순지수 구하기. t시점의 지수=(t시점의 시계열의 값/기준시의 시계열의 값)*100

복합지수(composite index numbers)

-여러개의 상품의 가격이나 수량의 변화를 근거로 하여 계산되는 지수

예측

질적인 방법

-주관적 판단

-과거의 정보가 어떻게 이용되었는 지 몰라서 다른 사람에 의해 재현될수 없으며 주로 개인의 경험에 의해 결정

양적인 방법

-모형을 이용한다.(이동평균법, 지수평활법, 다항추세모델 , 자가회귀누적이동평균모형 등)

평활법:불규칙한 변동을 제거하여 전반적인 추세를 뚜렷하게 파악할 수 있도록하여 예측을 쉽게 할 수 있도록 해주는 방법

이동평균법(moving average method)

-이동평균: N개의 인접한 관측값들의 평균

-이동평균값을 이용하여 시계열을 그린다. -> 기존에 비하여 변화하는 정도가 급격하기 않아 시계열의 장기추세를 쉽게 알 수 있다. ->이동평균값을 예측값으로 이용한다는 것을 의미

if) 우연변동만 평활하고자 한다면 -->N값을 작게

if) 계절변동만 평활하고자 한다면 -->N값을 계절의 주기와 같게

N값이 작아지면 평활되는 정도 감소 , 자료 손실 감소

N값이 커진다면 평활되는 정도 증가 , 자료 손실 증가 -->추세 파악 쉽다.

-단점:이동평균을 이용하여 평활을 구할시 미래의 값을 필요로 하므로 예측의 목적으로는 적합x, 이 문제는 과거의 값만 가지고 계산할 수 있으나 이러면 처음 N개의 자료를 잃어버려서 정보의 손실을 가져온다.

지수평활법(exponential smothing method)

-최근의 자료에 가중치를 주는 방법이다. -->0과1사이의 값을 가지는 지수평활계수w를 선택해야한다.

계산-> St= wZt + (1-w)S(t-1)-->St는 현재 관측값에 가중치 w를 두고 그 전의 지수평활값에 가중값(1-w)주서서 계산한다.

ex)S1=Z1, S2= wZ2 + (1-w)S1 , S3 = wZ3 + (1-w)S2 ..........

-w의 선택이 중요 --> 크면 최근값에 가중치를 더 주며 평활되는 정도가 작다.