군침이 싹 도는 코딩
resample 함수의 사용법과 인덱스 설정법 본문
chicago_df.index = chicago_df['Date']
chicago_df.head(2)
# Time Series 데이터를 처리할때 그룹바이 함수로는 날짜데이터를 바로 년 단위 월 단위 등으로
묶어서 처리가 불가능하다 따라서 이것을 처리해주는 함수 resample을 써야하는데 이것을 사용하기 위해서는
우선 인덱스를 Date 컬럼으로 만들어 줘야한다
df_year = chicago_df.resample('YS').size()
plt.plot(df_year)
plt.show()
# 리샘플을 사용해서 년의 시작점을 기준으로 묶어 차트를 그려보았다
# 리샘플에 들어가는 파라미터는 이 사진을 참고한다
'Python > Pandas' 카테고리의 다른 글
데이터 프레임을 불러올때 ParserError 디버깅 (0) | 2023.01.03 |
---|---|
추천 영화 작업 자동화 파이프라인 (0) | 2023.01.03 |
Item based collaborative filltering 을 하기위해 데이터프레임의 corr 함수를 이용해 correlation 과 min_periods 파라미터 사용법 (0) | 2023.01.03 |
Pandas pivot_table 함수 사용법 (0) | 2023.01.03 |
Python pandas 날짜 처리 (datetime) (0) | 2022.11.30 |