본문 바로가기
머신러닝

Overfitting, Undeffitting - 오버피팅, 언더피팅

by Chan_찬 2020. 7. 31.
728x90
반응형

underfitting, overfitting

Overfitting 이란?

학습데이터에 지나치게 일치하여 새로운 데이터를 올바르게 예측하지 못하는 것
새로운 데이터에 대한 성능이 좋지않음

Overfitting의 원인/특성

  • 학습데이터세트에서 지나치게 많은 정보를 추출하는 경우
    -> high variance (높은 분산)
  • 모델을 데이터에 과하게 맞추려고 하는 경우
    -> low bias (낮은 바이어스)

Underfitting 이란

학습데이터에 모델이 올바르게 동작하지 않고, 테스트데이터에도 올바르게 동작하지 않는다
학습 데이터가 충분하지 않았거나, 패턴을 잡아내지 못했다는 것

Underfitting의 특성

  • high bias -> 예측 결과가 정답과는 거리가 멀다
  • low variance -> 예측 결과끼리의 차이는 별로 없는 생태
728x90
728x90
BIG

'머신러닝' 카테고리의 다른 글

Stacking - 스태킹  (1) 2020.08.06
Boosting - 부스팅  (0) 2020.08.05
배깅 - bagging algorism  (0) 2020.08.04
Regularization - 복잡도에 패널티 주기, 오버피팅 피하기  (0) 2020.08.03
머신러닝 - 학습 데이터 속성  (0) 2020.07.30
Buy me a coffeeBuy me a coffee

댓글