특징

붓꽃 데이터를 이용한 학습

import sklearn
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split

print(sklearn.__version__)     #버전 확인

import pandas as pd

iris = load_iris()    #붓꽃 데이터 세트 로딩

iris_data = iris.data

iris_label = iris.target
print('iris target값: ', iris_label)
print('iris target명: ', iris.target_names)

#DataFrane으로 변환해서 확
iris_df = pd.DataFrame(data=iris_data, columns=iris.feature_names)
iris_df['label'] = iris.target
iris_df .head()

#train_test_split()을 이용하여 학습 데이터와 테스트 데이터 분할
X_train, X_test, y_train, y_test = train_test_split(iris_data, iris_label, test_size=0.2, random_state=11)
dt_clf = DecisionTreeClassifier(random_state=11)    #객체 생성
dt_clf.fit(X_train,y_train)    #학습 수행

#학습된 객체에서 테스트 데이터 세트로 예측 수
pred = dt_clf.predict(X_test)
from sklearn.metrics import accuracy_score
print('예측 정확도: {0:4f}'.format(accuracy_score(y_test,pred)))

사이킷런 주요 모듈

Untitled

Untitled