본문 바로가기

계량경제학 통계학

초보자가 3일 내에 통계패키지로 시계열자료를 분석해서 숙제 제출하기

제목부터 심란합니다.

어려운 계량경제학 중에서도 마지막 파트가 대개 시계열인데, 계량경제학에 대한 지식이 얕은 초보자가 3일안에 통계 패키지를 사용하여 모든 걸 해결할 수 있을까요.


시계열(Time Series) 데이터 분석을 위해서는

우선 시계열 자료가 안정성(Stationarity)를 가지고 있는지 분석을 해야합니다.
(즉 시계열자료의 평균, 분산 등이 시간변동에 따라 일정한지 여부)

Stationarity가 없으면, 어떠한 좋은 모델도 무의미한 결과를 가져오기 때문에 Stationarity 여부를 확인하는 것이 중요합니다.

Stationarity 여부를 체크해보는 제일 쉬운 방법이 ACF(Autocorrelation function), PACF(partial autocorrelation function)를 그려보는 것인데....

통계패키지(SAS, Stata등)를 사용하면 이런 그림을 그려보는 기능을 제공할 것입니다.

이렇게 해서 얻어진 그림의 자기상관계수(autocorrelation coefficient)가  시차가 증가할 수록 서서히 감소한다면 non-stationary , 불안정하다는 거지요.


시계열이 Unit root를 포함하는지를 체크하는 것이 Stationarity여부를 체크하는 좀더 세밀한 방법입니다. Dickey-Fuller test, Augmented Dickey-Fuller test가 이런 걸 체크하는 테스트 방법이고요.

좋은 모델이 AR(1) 이냐 MA(1)이냐 하는 것도 ACF와 PACF를 통해 확인할 수 있는데, 모델이 AR 구조의 특성이 있으면, ACF는 서서히 감소하며, PACF는 1기의 시차(1st lag)에서 급작스럽게 멈춤니다.

반대로 MA(1) 구조의 특성이 있다면, 반대의 특성이 있고요. ACF는 급작스럽게...PACF는 서서히 감소합니다.

실제 분석에서는 ARMA나 ARIMA도 많이 사용합니다.
 

글쓴이도 지금 기억을 더듬어가며 설명하고 있지만 제대로 공부하고 이해하기 어렵습니다.

 
숙제하기 전에 이미 계량경제학의 시계열 파트를 좀더 자세히 공부했어야 하고, SAS 등 통계패키지 사용방법도 좀더 세밀한 부분까지 익혀놓았어야 3일 내에 자료를 분석하겠지요.

시간적으로 쫓기는 상황에서 갑자기 해결될 수 있는 유일한 방법은 이미 남이 해 놓은 것을 베끼는 것인데
아무튼 쉽지는 않습니다.
 
극단적으로 말씀드리면,  이런 것 때문에 스트레스 받지 말고, 계량경제학을 공부해서 그렇게 익힌 지식을 써먹을 직업에 종사할 게 아니라면, 이런 걸 모르더라도 인생 사는데 전혀 지장이 없으니....그냥 맘 편하게 숙제를 안 내는 방법도 있습니다. 그냥 눈 꾹 감고 그 순간만 견디길.... ㅡ,.ㅡ