본문 바로가기

머신러닝

ML_introduction

iris dataset 분류

 

from sklearn.model_selection import train_test_split

가장 먼저 할일 : 데이터 살펴보기

scatter plot 좋음 (ndarray를 DataFrame으로 바꿔서 대입)


scikit-learn은 항상 데이터가 2차원 배열일 것이라고 예상

scikit-learn은 항상 NumPy 배열 형태의 데이터를 입력받음


knn 주요 파라미터 : n_neighbors

 

1. knn = KneighborsClassifier(n_neighbors=1)

2. knn.fit(X_train, y_train)

3. predict = knn.predict(X_new)

4. knn.score(X_test, y_test)   or   np.mean(y_pred==y_test)

 

fit, predict, score

https://github.com/HeeJaeMon123/ML_Practice/tree/main/introduction

'머신러닝' 카테고리의 다른 글

MLP  (0) 2021.07.21
svm  (0) 2021.07.15
tree  (0) 2021.07.15
linear model  (2) 2021.07.03
Supervised learning - KNN  (0) 2021.07.01