군침이 싹 도는 코딩
데이터셋을 트레이닝용과 테스트용으로 나누는법 (train_test_split) 본문
X
>>> array([[1. , 0. , 0. , 0.73913043, 0.68571429],
[0. , 0. , 1. , 0. , 0. ],
[0. , 1. , 0. , 0.13043478, 0.17142857],
[0. , 0. , 1. , 0.47826087, 0.37142857],
[1. , 0. , 0. , 0.34782609, 0.28571429],
[1. , 0. , 0. , 0.91304348, 0.88571429],
[0. , 1. , 0. , 1. , 1. ],
[1. , 0. , 0. , 0.43478261, 0.54285714]])
y
>>> array([0, 1, 0, 0, 1, 1, 0, 1])
X와 y를 트레이닝용과 테스트용으로 나눠보겠다
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state=3 )
X_train
>>> array([[1. , 0. , 0. , 0.34782609, 0.28571429],
[0. , 1. , 0. , 1. , 1. ],
[0. , 0. , 1. , 0.47826087, 0.37142857],
[0. , 0. , 1. , 0. , 0. ],
[1. , 0. , 0. , 0.73913043, 0.68571429],
[0. , 1. , 0. , 0.13043478, 0.17142857]])
X_test
>>> array([[1. , 0. , 0. , 0.91304348, 0.88571429],
[1. , 0. , 0. , 0.43478261, 0.54285714]])
y_train
>>> array([1, 0, 0, 1, 0, 0])
y_test
>>> array([1, 1])
train_test_split을 import해준다
train_test_split으로 변수 X y 를 나눠준다 테스트 사이즈는 0.2 (20프로라는뜻)
= 의 왼쪽에 저장받을 변수 4개를 입력한다
'Python > Machine Learning' 카테고리의 다른 글
인공지능 학습 데이터 전처리중 nan 처리 방법 (replace) (0) | 2022.12.02 |
---|---|
Logistic Regression (0) | 2022.12.01 |
LinearRegression (1) | 2022.12.01 |
피쳐 스케일링 (0) | 2022.12.01 |
레이블 인코딩 / 원핫 인코딩 (0) | 2022.12.01 |