Python/Pandas
resample 함수의 사용법과 인덱스 설정법
mugoori
2023. 1. 3. 15:30
chicago_df.index = chicago_df['Date']
chicago_df.head(2)
# Time Series 데이터를 처리할때 그룹바이 함수로는 날짜데이터를 바로 년 단위 월 단위 등으로
묶어서 처리가 불가능하다 따라서 이것을 처리해주는 함수 resample을 써야하는데 이것을 사용하기 위해서는
우선 인덱스를 Date 컬럼으로 만들어 줘야한다
df_year = chicago_df.resample('YS').size()
plt.plot(df_year)
plt.show()
# 리샘플을 사용해서 년의 시작점을 기준으로 묶어 차트를 그려보았다
# 리샘플에 들어가는 파라미터는 이 사진을 참고한다