군침이 싹 도는 코딩

Python 히스토그램 본문

Python/Matplotlib

Python 히스토그램

mugoori 2022. 11. 28. 12:15

히스토그램

히스토그램이란 구간을 설정하여 해당 구군에 포함되는 데이터가

몇개인지를 세는 차트를 히스토그램이라고한다

구간을 bin 이라고 하며 여러개의 구간이 있으므로 bins라고 한다

히스토그램은 똑같은 데이터를 가지고

bin 의 값을 조정하기때문에 차트 모양이 각기 달라

해석이 달라질수있다

 

해당 데이터 프레임부분의 스피드 컬럼 부분으로 히스토그램을 만들어보자

 

 

plt.hist(data=df,x='speed')
plt.show()

# bins 의 기본 갯수는 10개이다

 

 

 

bins 의 갯수나 범위를 변경하는법

plt.hist(data=df,x='speed',rwidth=0.8,bins=30)
plt.show()

# rwidth는 그래프 사이의 폭을 떨어트릴수있다

bins를 사용하여 그래프의 갯수를 조절할수있다.

 

 

 

df['speed'].min() #최소값
df['speed'].min() #최대값
my_bins=np.arange(5, 160+3, 3) # 두개를 구한 값을 넣고 넘파이 어레인지로 범위를 설정해서 저장
plt.hist(data=df,x='speed',rwidth=0.8,bins=my_bins)
plt.show()

# 먼저 최소값과 최대값을 구한다

그 후 넘파이어레인지로 최소 최대 범위를 지정해 변수에 저장

그 후 bins에 변수를 넣으면 범위를 지정해 히스토그램을 만들수있다.