데이터셋을 트레이닝용과 테스트용으로 나누는법 (train_test

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

군침이 싹 도는 코딩

데이터셋을 트레이닝용과 테스트용으로 나누는법 (train_test_split) 본문

Python/Machine Learning

데이터셋을 트레이닝용과 테스트용으로 나누는법 (train_test_split)

mugoori 2022. 12. 1. 11:46

X
>>> array([[1.        , 0.        , 0.        , 0.73913043, 0.68571429],
          [0.        , 0.        , 1.        , 0.        , 0.        ],
          [0.        , 1.        , 0.        , 0.13043478, 0.17142857],
          [0.        , 0.        , 1.        , 0.47826087, 0.37142857],
          [1.        , 0.        , 0.        , 0.34782609, 0.28571429],
          [1.        , 0.        , 0.        , 0.91304348, 0.88571429],
          [0.        , 1.        , 0.        , 1.        , 1.        ],
          [1.        , 0.        , 0.        , 0.43478261, 0.54285714]])

y
>>> array([0, 1, 0, 0, 1, 1, 0, 1])

X와 y를 트레이닝용과 테스트용으로 나눠보겠다

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state=3 )

X_train
>>> array([[1.        , 0.        , 0.        , 0.34782609, 0.28571429],
          [0.        , 1.        , 0.        , 1.        , 1.        ],
          [0.        , 0.        , 1.        , 0.47826087, 0.37142857],
          [0.        , 0.        , 1.        , 0.        , 0.        ],
          [1.        , 0.        , 0.        , 0.73913043, 0.68571429],
          [0.        , 1.        , 0.        , 0.13043478, 0.17142857]])
       
X_test
>>> array([[1.        , 0.        , 0.        , 0.91304348, 0.88571429],
          [1.        , 0.        , 0.        , 0.43478261, 0.54285714]])
       
y_train
>>> array([1, 0, 0, 1, 0, 0])

y_test
>>> array([1, 1])


train_test_split을 import해준다
train_test_split으로 변수 X y 를 나눠준다 테스트 사이즈는 0.2 (20프로라는뜻)
= 의 왼쪽에 저장받을 변수 4개를 입력한다

저작자표시 (새창열림)

'Python > Machine Learning' 카테고리의 다른 글

인공지능 학습 데이터 전처리중 nan 처리 방법 (replace) (0)	2022.12.02
Logistic Regression (0)	2022.12.01
LinearRegression (1)	2022.12.01
피쳐 스케일링 (0)	2022.12.01
레이블 인코딩 / 원핫 인코딩 (0)	2022.12.01

'Python/Machine Learning' Related Articles

군침이 싹 도는 코딩

데이터셋을 트레이닝용과 테스트용으로 나누는법 (train_test_split) 본문

데이터셋을 트레이닝용과 테스트용으로 나누는법 (train_test_split)

'Python > Machine Learning' 카테고리의 다른 글

티스토리툴바