본문 바로가기

머신러닝

분류 예측의 불확실성 추정

1. decision_function

반환 크기는 (n_samples,)이고 각 샘플이 하나의 실수값 반환

데이터 포인트가 클래스 1에 속한다고 믿는 정도

 

2. predict_proba

출력은 각 클래스에 대한 확률

항상 0~1사이이고 합은 1

이진분류에서는 출력의 첫번째 원소는 첫번째 예측 확률, 두번째 원소는 두번째 클래스 예측 확률

 

다중 분류에서도 가능

다중 분류에서 decision function의 결과 크기는 (n_samples, n_classes) , 수치가 크면 그 클래스일 확률 높음

 

다중 분류에서 predict_proba의 결과 크기는 (n_samples, n_classes) , 수치가 크면 그 클래스일 확률 높음// 합은 1

 

 

 predict_proba, decision function의 결과 크기는 항상 (n_samples, n_classes)

하지만 이진 부류의 decision function은 다름  - > 열은 하나이고 양성클래스 (클래스 1)에 대응하는 값을 가짐

 

 

 

 

'머신러닝' 카테고리의 다른 글

비지도 학습(데이터 전처리와 스케일 조정)  (0) 2021.07.22
지도학습 총정리  (0) 2021.07.21
MLP  (0) 2021.07.21
svm  (0) 2021.07.15
tree  (0) 2021.07.15