군침이 싹 도는 코딩

Python pandas csv 파일 불러와 세분화하기 본문

Python/Pandas

Python pandas csv 파일 불러와 세분화하기

mugoori 2022. 11. 24. 12:26

csv 파일을 불러오는법

reviews=pd.read_csv('../data/winemag-data_first150k.csv',index_col=0)

 

 

#  index_col=0 은 unnamed:0라는 인덱스로 사용되던것이 컬럼 자리에 올라가 있는것을 없애주는것

 

 

 

데이터 프레임의 윗부분부터 보는법

reviews.head()

# head() 라는 함수를 쓰며 안에 파라미터값을 넣으면 해당값만큼 아니면 5개를 디폴트로 보여준다

 

 

 

데이터 프레임의 뒷부분부터 보는법

reviews.tail()

# tail() 라는 함수를 쓰며 안에 파라미터값을 넣으면 해당값만큼 아니면 5개를 디폴트로 보여준다

 

 

 

데이터 프레임의 숫자데이터의 통계를 보는법

reviews.describe()

# count 는 비어있는 데이터를 제외한 갯수

# mean 평균

# std 표준편차

# min 최소

# max 최대

 

 

 

 

 

 

 

데이터 프레임의 정보를 보는법

reviews.info()
>>> <class 'pandas.core.frame.DataFrame'>
    Int64Index: 150930 entries, 0 to 150929
    Data columns (total 10 columns):
     #   Column       Non-Null Count   Dtype  
    ---  ------       --------------   -----  
     0   country      150925 non-null  object 
     1   description  150930 non-null  object 
     2   designation  105195 non-null  object 
     3   points       150930 non-null  int64  
     4   price        137235 non-null  float64
     5   province     150925 non-null  object 
     6   region_1     125870 non-null  object 
     7   region_2     60953 non-null   object 
     8   variety      150930 non-null  object 
     9   winery       150930 non-null  object 
    dtypes: float64(1), int64(1), object(8)
    memory usage: 12.7+ MB

# non-null 은 비어 있는 데이터를 제외한 값 Dtype 은 데이터의 종류