본문 바로가기

머신러닝11

Overfitting, Undeffitting - 오버피팅, 언더피팅 Overfitting 이란? 학습데이터에 지나치게 일치하여 새로운 데이터를 올바르게 예측하지 못하는 것 새로운 데이터에 대한 성능이 좋지않음 Overfitting의 원인/특성 학습데이터세트에서 지나치게 많은 정보를 추출하는 경우 -> high variance (높은 분산) 모델을 데이터에 과하게 맞추려고 하는 경우 -> low bias (낮은 바이어스) Underfitting 이란 학습데이터에 모델이 올바르게 동작하지 않고, 테스트데이터에도 올바르게 동작하지 않는다 학습 데이터가 충분하지 않았거나, 패턴을 잡아내지 못했다는 것 Underfitting의 특성 high bias -> 예측 결과가 정답과는 거리가 멀다 low variance -> 예측 결과끼리의 차이는 별로 없는 생태 2020. 7. 31.
머신러닝 - 학습 데이터 속성 머신러닝 작업은 학습 데이터의 속성에 따라 나뉜다 비지도 학습 (Unsupervised learning) 레이블 없는 데이터 (unlabeled data) 로 데이터의 구조나, 패턴을 찾고 데이터를 그룹화한다 지도 학습 (Supervised learning) 레이블 데이터 (labeled data) 를 사용 학습 목표는 입력과 결과를 매핑시키는 룰을 찾는 것 ex> 얼굴인식, 음성인식, 상품추천, 영화추천, 영업실적 전망 1. 회귀 (regression) 연속적인 값을 학습하고 예측하는 것 집값 예측 등 2. 분류 (classification) 긍정/부정 같은 감성 분석이나 채무 불이행 예측 같은 레이블을 찾는 것 준지도 학습 학습단계에서 (소량의) 레이블데이터와 (대량의) 레이블이 없는 데이터를 사용 .. 2020. 7. 30.