최근접 이웃 : 간단, 좋음
선형모델 : 대용량 데이터셋 가능, 고차원에도 가능
나이브 베이즈 : 분류만 가능, 선형모델보다 훨 빠름, 대용량, 고차원 가능하지만 선형보다 덜 정확
결정 트리 : 매우 빠름, 데이터 스케일 조정 필요없음, 시각화 좋음
랜덤 포레스트 : 결정트리 하나보다 거의 항상 좋은 성능 냄, 안정적, 강력, 데이터 스케일 조정 필요 없음, 고차원 데이터에는 잘 안맞음
그레디언트 부스팅 결정트리 : 랜덤 포레스트보다 조금더 성능 좋음. 랜덤보다 학습느리지만 예측 빠르고 메모리 조금사용 랜덤보다 매개변수 튜닝 많이 필요함
서포트 벡터머신 : 중간 규모 데이터셋에 잘 맞음, 데이터 스케일 필요, 매개변수 민감
신경망 : 대용량 데이터셋에서 매우 복잡한 모델 만들수 있음 데이터 스케일 필요, 매개변수 민감, 큰모델은 학습 오래걸림
처음에는 선형, 나이브, 최근접 같은 간단한 모델로 시작해서 성능 가늠하고 데이터 충분히 이해한뒤 복잡한 모델 사용
'머신러닝' 카테고리의 다른 글
| 차원축소, 특성 추출, 매니폴드 학습 (0) | 2021.07.22 |
|---|---|
| 비지도 학습(데이터 전처리와 스케일 조정) (0) | 2021.07.22 |
| 분류 예측의 불확실성 추정 (0) | 2021.07.21 |
| MLP (0) | 2021.07.21 |
| svm (0) | 2021.07.15 |