Attention please

히스토그램 그리기(hist) - matplotlib 본문

데이터 시각화/matplotlib

히스토그램 그리기(hist) - matplotlib

Seongmin.C 2022. 10. 8. 13:50

히스토그램은 도수분포표를 그래프로 나타낸 것입니다.

 

주로 분포를 확인할 때 자주 사용되는 시각화 기법입니다.

 

 

 

그러면 코드부터 살펴보겠습니다.

 

fig = plt.figure(figsize = (5,3), dpi = 100)
ax = fig.subplots()

data = np.random.normal(size = 1000)

_=ax.hist(data, bins = 20, edgecolor = 'k')

히스토그램을 그리기 위해 사용하는 함수는 hist입니다.

 

이 hist함수에는 bins와 edgecolor 파라미터가 존재하는데

bins 파라미터는 생성되는 막대그래프의 개수입니다.

 

그래서 bin수가 20개라면

주어진 data의 최대값, 최소값 사이를 bin 수만큼 균등하게 나누어 표현합니다.

 

다음으로 edgecolor를 설정하여 가장자리 색을 설정할 수 있습니다.

 

 

 

 

 

 

 

 

 

 

 

density

hist 함수에는 density라는 파라미터가 존재합니다.

 

디폴트값은 False이며,

True로 설정해주면 y축이 데이터의 개수에서 빈도수로 변경됩니다.

 

fig = plt.figure(figsize = (8,4), dpi = 100)
axs = fig.subplots(1,2)

data = np.random.normal(0,1,size = 1000)

_=axs[0].hist(data, bins = 30, edgecolor = 'k')
_=axs[1].hist(data, bins = 30, edgecolor = 'k', color = 'g', density = True)

 

 

보시면 y축의 값이 개수에서 빈도수로 변한 것을 볼 수 있습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Comments