728x90
반응형
Overfitting 이란?
학습데이터에 지나치게 일치하여 새로운 데이터를 올바르게 예측하지 못하는 것
새로운 데이터에 대한 성능이 좋지않음
Overfitting의 원인/특성
- 학습데이터세트에서 지나치게 많은 정보를 추출하는 경우
-> high variance (높은 분산) - 모델을 데이터에 과하게 맞추려고 하는 경우
-> low bias (낮은 바이어스)
Underfitting 이란
학습데이터에 모델이 올바르게 동작하지 않고, 테스트데이터에도 올바르게 동작하지 않는다
학습 데이터가 충분하지 않았거나, 패턴을 잡아내지 못했다는 것
Underfitting의 특성
- high bias -> 예측 결과가 정답과는 거리가 멀다
- low variance -> 예측 결과끼리의 차이는 별로 없는 생태
728x90
728x90
BIG
'머신러닝' 카테고리의 다른 글
Stacking - 스태킹 (1) | 2020.08.06 |
---|---|
Boosting - 부스팅 (0) | 2020.08.05 |
배깅 - bagging algorism (0) | 2020.08.04 |
Regularization - 복잡도에 패널티 주기, 오버피팅 피하기 (0) | 2020.08.03 |
머신러닝 - 학습 데이터 속성 (0) | 2020.07.30 |
댓글