청개구리

MAE vs. MSE 본문

데이터분석/Evaluation

MAE vs. MSE

hylajaponica 2024. 6. 27. 16:09

MAE (Mean Absolute Error)와 MSE (Mean Squared Error)는 모두 회귀 모델의 성능을 평가하기 위해 사용되는 지표이다.

그러나 그 계산 방식과 의미에는 차이가 있다.

1. MAE (Mean Absolute Error)
\[ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} | y_i - \hat{y}_i | \]

여기서 \( y_i \)는 실제 값, \( \hat{y}_i \)는 예측 값, \( n \)은 데이터 포인트의 수이다.

MAE는 예측 값과 실제 값 사이의 절대 차이의 평균을 나타낸다.

[특징]
1. MAE는 예측 값과 실제 값 사이의 평균 절대 차이를 제공하여 직관적으로 해석하기 쉽다.
2. MAE는 MSE에 비해 이상치(Outlier)에 덜 민감하다. 이는 절대값을 사용하기 때문이다.
3. MAE의 단위는 원래 데이터와 동일하다.

[사용 시기]
- 이상치가 많을 때: 이상치의 영향을 줄이기 위해 MAE를 사용하는 것이 좋다.
- 해석이 쉬운 지표가 필요할 때: 결과를 쉽게 해석하고 싶을 때 사용된다.

2. MSE (Mean Squared Error)
\[ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} ( y_i - \hat{y}_i )^2 \]

여기서 \( y_i \)는 실제 값, \( \hat{y}_i \)는 예측 값, \( n \)은 데이터 포인트의 수이다.

MSE는 예측 값과 실제 값 사이의 제곱 차이의 평균을 나타낸다.

[특징]
1. MSE는 오차를 제곱하기 때문에 큰 오차에 대해 더 큰 패널티를 부과한다. 이는 모델이 큰 오차를 피하도록 만든다.
2. MSE의 단위는 원래 데이터의 제곱 단위이므로 해석이 다소 어렵다.
3. MSE는 미분 가능하므로, 최적화 알고리즘에서 많이 사용된다.

[사용 시기]:
- 큰 오차를 중요하게 다룰 때: 큰 오차를 줄이는 것이 중요한 경우, MSE를 사용하는 것이 좋다.
- 수학적 편의성: 모델 최적화에 있어 미분 가능성이 중요한 경우, MSE를 사용한다.

즉, MAE는 평균 절대 오차로, 이상치에 덜 민감하며 단위가 데이터와 동일하다.
또한, MSE는 평균 제곱 오차로, 큰 오차에 더 민감하고 최적화에 유리하다.

둘 중 어느 것을 사용할지는 문제의 특성과 목적에 따라 다르다.

예를 들어, 가격 예측과 같이 실제 값과의 차이가 중요할 때는 MAE를,

큰 오차를 특히 줄이고 싶을 때는 MSE를 사용하는 것이 좋다.