1. 구간(이동) 평균법(Moving Average, MA)
- 지수평활법의 시작점. 과거시점의 일정 기간(N)의 평균으로 다음 시점을 예측.
- 과거 N 개의 데이터에 동일한 가중치를 둠.
- 예를 들어, 아래 데이터의 경우 t=6에서의 구간 평균치(70+28+72/3)인 56.67으로 이후 시점들의 예측값으로 사용. 즉, 미래 예측값이 모두 동일.
- 트렌드가 없고 분산, 평균이 일정한 데이터는 구간 평균법이 잘 맞음.
- Hyper parameter : N / N이 작은 경우 최근 데이터 경향을 많이 반영, N이 큰 경우 과거 데이터 경향 많이 반영해 편평하게 예측.
2. 단순지수평활법(Simple Exponential Smoothing)
- Smoothing이란 결국 '평균'을 구한다는 뜻. 단순지수평활법은 이전 관측치들의 가중 평균값인데, 최근 값에 높은 가중치를 둠. 즉, 가장 최근의 관측값을 가장 중요하게 생각하고, 이전의 모든 관측값은 미래를 예측할 때 거의 아무런 정보를 주지 않는다고 가정함.
- 최근 관측치에 더 큰 가중치(0 <= alpha <= 1)를 둠. 과거로 갈수록 가중치가 지수적으로 감소함.
- L(0)는 전체 데이터의 평균값.
- L(t+1)는 시간 t+1에서 시계열의 수준값(평활화 된 값). 즉, t+1 시점의 현재 데이터와 이전 수준(이전 데이터들의 누적값)의 가중 평균.
- 마지막 수준값을 이후 시점의 예측값들로 사용, 즉 예측값들이 동일함 => 트렌드가 없는 데이터에 적합한 방법.
- 'smooth'한 데이터의 경우 큰 alpha값 사용해 최근 데이터에 큰 가중치 적용, 'nosiy'한 데이터의 경우 작은 alpha 사용해 과거 데이터에 보다 큰 가중치 적용.
- 가중치 alpha는 SSE를 최소화(최적화 도구 사용)해 추정. (잔차 = y(t) - y(t)')
3. 홀트의 선형추세 기법(Holt's Exponential Smoothing / Double Exponential Smoothing)
- Holt(1957)는 추세가 있는 데이터를 예측할 수 있도록 단순 지수평활법을 확장함.
- 수준(level)만 고려하는게 아니라 추세 B(t) 도 고려함. B(t)도 업데이트.
- L(0)와 B(0)는 회귀분석으로 결정함.
- 종속변수를 관측값으로, 독립변수를 시간 인덱스로 하여 회귀분석 => 기울기 : 추세 B(0), 절편 : L(0)
- L(0) : 회귀분석에서 X가 0일 때 종속변수의 평균값.
- B(0) : X 1 단위 증가시, 여기서는 시간 인덱스 1 증가시 y의 증가량. 즉, 추세를 반영함.
- L(t+1)는 시간 t+1에서의 수준 추정값
- 구하는 방법은 앞선 단순 지수평활법과 같은데 growth rate인 b(t)도 고려함.
- B(t+1)는 시간 t+1에서 추세 추정값
- 이전의 추세 B(t)를 '(1-beta*)가장 최근 수준값들의 차이 + (beta*)이전 추세값'으로 업데이트 함.
- 여기서 가장 최근 수준값들의 차이는 결국 기울기, 즉 추세를 의미함.
- beta*는 추세의 평활 매개변수. (0 <= beta* <= 1)
- beta*는 추세를 조절하는 속도를 정함.
- 예측값은 마지막 수준값 + (상수(예측하고자 하는 시점)*마지막 추세값)
- 즉, 수준은 고정되어 있고, 추세값에 상수배를 하며 예측값이 달라짐.
- alpha, beta*는 training set의 RMSE 나 MAPE를 최소화하는 값을 찾음.
4. 홀트-윈터(Holt-Winter) 지수평활법(삼중 지수평활법)
- 이중 지수평활법에 계절 요인까지 반영한 방법.
- (작성 대기)
5. 시계열 특징에 따른 지수평활법 선택
[참고자료]
https://www.youtube.com/watch?v=DUyZl-abnNM
https://www.youtube.com/watch?v=noFCkN6gXZ4&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=8
'🥐데이터분석' 카테고리의 다른 글
Markov Chain Monte Carlo (MCMC) Sampling, MCMC 샘플링 (0) | 2021.08.18 |
---|---|
[CLV/LTV 예측] Pareto/NBD 모델 (0) | 2021.08.18 |
Bayesian Theorem(베이즈 정리), 베이즈 통계학 기초 (0) | 2021.08.18 |
Light GBM (0) | 2021.07.25 |
[시계열] ARIMA 모델 (0) | 2021.07.25 |