군침이 싹 도는 코딩
Dummy variable trap 본문
X
>>> array([[1.0, 0.0, 0.0, ..., 1, 1, 101348.88],
[0.0, 0.0, 1.0, ..., 0, 1, 112542.58],
[1.0, 0.0, 0.0, ..., 1, 0, 113931.57],
...,
[1.0, 0.0, 0.0, ..., 0, 1, 42085.58],
[0.0, 1.0, 0.0, ..., 1, 0, 92888.52],
[1.0, 0.0, 0.0, ..., 1, 0, 38190.78]], dtype=object)
X[:,1:]
>>> array([[0.0, 0.0, 619, ..., 1, 1, 101348.88],
[0.0, 1.0, 608, ..., 0, 1, 112542.58],
[0.0, 0.0, 502, ..., 1, 0, 113931.57],
...,
[0.0, 0.0, 709, ..., 0, 1, 42085.58],
[1.0, 0.0, 772, ..., 1, 0, 92888.52],
[0.0, 0.0, 792, ..., 1, 0, 38190.78]], dtype=object)
# 원핫 인코딩을 하고서 3개로 갈라진 컬럼중에 맨 왼쪽 컬럼은 삭제해도
0과 1로 데이터를 전부 나타 낼수 있다
앞의 세가지 컬럼은 France, Germerny, Spain 이라는 컬럼인데
예를 들어
Germerny, Spain
0 0 => 프랑스
1 0 => 독일
0 1 => 스페인
이런식으로 맨 왼쪽인 France를 삭제해도 나머지 둘의 값이 0이면
그것이 프랑스라는것을 알 수 있다
이것을 더미 바리에이블 트랩이라고 한다
'Python > Deep Learning' 카테고리의 다른 글
번외) 새로운 데이터를 통해 가격 예측 (0) | 2022.12.28 |
---|---|
텐서플로우 리그레션 문제 모델링 하는 방법 (0) | 2022.12.28 |
텐서플로우를 이용한 그리드 서치 방법 (0) | 2022.12.27 |
텐서플로우로 분류의 문제 모델링 하는 방법 (0) | 2022.12.27 |
fit 함수에서 epoch 와 batch_size에 대한 설명 (0) | 2022.12.27 |