군침이 싹 도는 코딩
Python pandas csv 파일 불러와 세분화하기 본문
csv 파일을 불러오는법
reviews=pd.read_csv('../data/winemag-data_first150k.csv',index_col=0)
# index_col=0 은 unnamed:0라는 인덱스로 사용되던것이 컬럼 자리에 올라가 있는것을 없애주는것
데이터 프레임의 윗부분부터 보는법
reviews.head()
# head() 라는 함수를 쓰며 안에 파라미터값을 넣으면 해당값만큼 아니면 5개를 디폴트로 보여준다
데이터 프레임의 뒷부분부터 보는법
reviews.tail()
# tail() 라는 함수를 쓰며 안에 파라미터값을 넣으면 해당값만큼 아니면 5개를 디폴트로 보여준다
데이터 프레임의 숫자데이터의 통계를 보는법
reviews.describe()
# count 는 비어있는 데이터를 제외한 갯수
# mean 평균
# std 표준편차
# min 최소
# max 최대
데이터 프레임의 정보를 보는법
reviews.info()
>>> <class 'pandas.core.frame.DataFrame'>
Int64Index: 150930 entries, 0 to 150929
Data columns (total 10 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 country 150925 non-null object
1 description 150930 non-null object
2 designation 105195 non-null object
3 points 150930 non-null int64
4 price 137235 non-null float64
5 province 150925 non-null object
6 region_1 125870 non-null object
7 region_2 60953 non-null object
8 variety 150930 non-null object
9 winery 150930 non-null object
dtypes: float64(1), int64(1), object(8)
memory usage: 12.7+ MB
# non-null 은 비어 있는 데이터를 제외한 값 Dtype 은 데이터의 종류
'Python > Pandas' 카테고리의 다른 글
Python pandas카테고리컬 데이터 (0) | 2022.11.24 |
---|---|
Python pandas NaN 처리 방법 (isna,notna,fillna,dropna) (0) | 2022.11.24 |
Python pandas 데이터 추가/삭제/변경 (0) | 2022.11.24 |
Python pandas 데이터 값 수정 (0) | 2022.11.24 |
Python pandas DataFrame(데이터프레임) 억세스 (0) | 2022.11.23 |