히비스서커스의 블로그

[Concept] 시계열 예측 지표 (MSE, MAE, RMSE, MAPE) 본문

Theory/Machine Learning

[Concept] 시계열 예측 지표 (MSE, MAE, RMSE, MAPE)

HibisCircus 2021. 3. 6. 09:39
728x90

시계열 분석에 평가할 수 있는 지표들을 정리해보기로 하였다. 이들은 전부 기계학습의 회귀문제에서 손실함수로 사용될 수 있는 지표들이다.



위의 개념들을 알아보기 전에 SST와 SSR, SSE부터 알아보자. 이 개념들은 실제 값에 회귀의 개념을 도입하였을 때 나오는 개념들이다.

놀랍게도 아래와 같은 식은 성립한다.

SST(실제 관측값과 관측값의 평균값 차이의 제곱 합) = SSR(회귀식으로 예측한 값과 평균값 차이의 제곱 합) + SSE(실제 관측값과 회귀식으로 예측한 값 차이의 제곱 합)

 

여기서, SSR과 SSE가 가지는 의미를 간단히 살펴보자. SSR은 추정된 회귀식으로 설명이 되는 부분, SSE는 설명이 안되는 부분이다. 우리는 회귀식을 통해 실제 값을 예측하고 싶은 것이기 때문에 SSR은 크고 SSE는 작길 원한다.

 

 

참고
$$ e_{i} = y_{i} - ypred_{i} $$



MSE(Mean Squared Error)

$$ MSE = \frac{1}{n}\sum_{t=1}^{n} e_{t}^{2} $$

MSE는 SSE를 자유도로 나누어준 값이다. 자유도를 나누어 줌으로써 MSE가 크다의 의미는 단순히 데이터가 많아서 크다는 것이 아니라(SSE는 데이터 수가 많아지면 커진다.) 실제 차이가 커서 크다고 판단할 수 있게 되는 것이다.



MAE(Mean Absolute Error)

$$ MAE = \frac{1}{n}\sum_{t=1}^{n} \left | e_{t} \right | $$

MAE는 실제 관측값과 회귀식으로 예측한 값 차이를 제곱 합이 아닌 절대값의 합을 해준 것이다. MSE가 R2 Norm을 사용했더라면 MAE는 R1 Norm을 사용한 것이라고 할 수 있다.



RMSE(Root Mean Squared error)

$$ RMSE = \sqrt{\frac{1}{n}\sum_{t=1}^{n} e_{t}^{2}} $$

RMSE는 MSE에 루트를 씌워준 값이다.



MAPE(Mean Absolute Percentage Error)

$$ MAPE =\frac{1}{n}\sum_{t=1}^{n} \frac{\left | e_{t} \right | }{ ypred_{i}} $$

MAPE는 MAE에서 실제 관측값과 회귀식으로 예측한 값 차이를 회귀식으로 예측한 값으로 나눈 절대값의 합이다. MAE는 outlier에 취약할 수 있는데(한 없이 커질 수 있다는 의미이다.) MAPE는 최대 크기가 제한되므로 이를 보완한 개념이라고 볼 수 있다.



 

참고자료

theprofessionalspoint.blogspot.com/2019/02/loss-functions-in-machine-learning-mae.html

 

Loss Functions in Machine Learning (MAE, MSE, RMSE)

Delphi, C#, Python, Machine Learning, Deep Learning, TensorFlow, Keras

theprofessionalspoint.blogspot.com



 

-히비스서커스-

728x90