시계열 분석시계열 데이터에서 미래를 예측하거나 데이터의 특성을 파악하는 통계기법으로 대부분의 시계열 데이터에 해당하는 비정상 데이터를 정상 데이터로 변환하는 과정이 필요하다.
① 자기회귀 모델(AR): 포인트 p 이전의 데이터가 현재 데이터에 영향을 주는 모델
하나) AR(1) 모델: 이전 시점의 데이터만 분석
Zt=ɸ1Z(t-1)+~에
2) AR(2) 모델: 약 2개의 연속된 시점의 데이터로 분석
Zt=ɸ1Z(t-1)+ɸ2Z(t-2)+~에
* Zt: 현재 시점의 시계열 데이터
* ɸp: p의 점이 현재 시제에 얼마나 영향을 미치는지 나타내는 매개변수
* αt(백색 잡음 과정): 시계열 분석의 오차항으로 서로 독립적이고 동일한 분포를 따르는 일련의 랜덤 변수로 구성됩니다.
② 이동 평균(MA) 모델: 유한한 수의 백색잡음의 조합이므로 항상 정상성을 만족한다.
하나) MA(1) 모델: 시계열에서 동시에 백색 잡음과 이전 시간에서 백색 잡음의 조합
Zt =αt-θ1α(t-1)
2) AR(2) 모델: 이전 시간의 백색 잡음과 2 지연된 백색 잡음의 조합
Zt =αt-θ1α(t-1)-θ2α(t-2)
AR 모델 | MA 모델 | |
자기 상관 함수(ACF) | 빨리 이륙 | 특정 시점에 컷오프 지점이 있습니다. |
부분 자기 기능(PACF) | 특정 시점에 컷오프 지점이 있습니다. |
빨리 이륙 |
관련 주문 | 피 | 큐 |
③ 자기회귀 누적 이동 평균 모델(ARIMA(p,d,q)):
AR, MA 또는 이 둘의 조합인 ARMA 모델로 차이를 구분하거나 변환하여 정규화해야 하는 불안정한 시계열 모델입니다.
1) p=0 → IMA(d,q) 모델이라 하고 d가 다를 경우 MA(q) 모델을 따른다.
전. ARIMA(0, 1, 1): 1 차이 후 공액 MA(1)
2) d=0 → ARMA(p,q) 모델이라고 하며 정상성을 만족하는 모델입니다.
3) q=0 → ARI(p, d) 모델이라고 하며 d배일 때 AR(p) 모델을 따릅니다.
전. ARIMA(1, 1, 0): 차수가 1인 후 AR(1)을 공액화합니다.
ARIMA(1, 1, 2): AR(1), MA(1), ARMA(1, 2) 중 1 차이로 선택 사용법: 가장 간단한 모델 또는 AIC 값이 가장 낮은 모델 선택
* 차이점: 평균이 일정하지 않은 시계열을 정규화하는 방법으로 현재 포인트 데이터에서 이전 포인트 데이터를 뺍니다.
하나) 일반적인 차이: 이전 시간에서 데이터를 빼는 방법
2) 계절의 차이: 보다 최근 시점 이전의 데이터를 빼는 방법으로 계절성을 가지고 데이터를 정규화하는데 주로 사용된다.
* 변환: 일정하지 않은 분산으로 시계열을 정규화하는 방법
분해의 시계열시계열에서 시계열에 영향을 미치는 공통요인을 분리하여 분석하는 방법으로 주로 회귀분석을 이용한다.