iris dataset 분류
from sklearn.model_selection import train_test_split
가장 먼저 할일 : 데이터 살펴보기
scatter plot 좋음 (ndarray를 DataFrame으로 바꿔서 대입)
scikit-learn은 항상 데이터가 2차원 배열일 것이라고 예상
scikit-learn은 항상 NumPy 배열 형태의 데이터를 입력받음
knn 주요 파라미터 : n_neighbors
1. knn = KneighborsClassifier(n_neighbors=1)
2. knn.fit(X_train, y_train)
3. predict = knn.predict(X_new)
4. knn.score(X_test, y_test) or np.mean(y_pred==y_test)
fit, predict, score
https://github.com/HeeJaeMon123/ML_Practice/tree/main/introduction
'머신러닝' 카테고리의 다른 글
| MLP (0) | 2021.07.21 |
|---|---|
| svm (0) | 2021.07.15 |
| tree (0) | 2021.07.15 |
| linear model (2) | 2021.07.03 |
| Supervised learning - KNN (0) | 2021.07.01 |