ML_introduction

iris dataset 분류

from sklearn.model_selection import train_test_split

가장 먼저 할일 : 데이터 살펴보기

scatter plot 좋음 (ndarray를 DataFrame으로 바꿔서 대입)

scikit-learn은 항상 데이터가 2차원 배열일 것이라고 예상

knn 주요 파라미터 : n_neighbors

1. knn = KneighborsClassifier(n_neighbors=1)

2. knn.fit(X_train, y_train)

3. predict = knn.predict(X_new)

4. knn.score(X_test, y_test) or np.mean(y_pred==y_test)

fit, predict, score