본문 바로가기
Python/Data Science

Data Science - 시각화 (2)

by hooni40 2021. 8. 22.
728x90
반응형

 안녕하세요, 이전 시간에는 Data Science에서 Data Frame의 시각화의 필요성과 선 그래프에 대하여 정리하였습니다. 오늘은 막대그래프에 대해 알아보겠습니다. 그전에 이 글에서 다룰 데이터는 남자/여자의 선호하는 운동에 대한 데이터입니다.

 

원본 Data Frame

 

 우선 막대그래프에 대해 먼저 알아보겠습니다. 막대그래프는 다양한 카테고리들을 비교하기에 좋은 그래프입니다. Pandas에서 막대그래프를 그리는 방법은 plot()함수 내에 kind='bar'로 설정해 주는 것입니다. 복습을 하고 넘어가자면 지난 시간에 정리한 선 그래프는 기본 그래프이므로 kind를 따로 지정해주지 않았습니다. (kind='line'이 기본 값입니다.)

 

위는 선 그래프/ 아래는 막대 그래프

 

 위의 막대그래프에 여러 가지 변화를 줄 수 있는데요, 우선 세로 막대그래프가 아닌 가로 막대그래프로 나타내려면 kind를 'barh'로 바꿔주면 됩니다. 여기서 h는 horizontal(수평의)의 h입니다! 또한 위의 데이터에서 남자/여자가 따로 되어있는데요, 이것을 합쳐주려면 stacked=Ture를 넣어주면 됩니다. 이렇게 합쳐주게 된다면 남녀 합쳐서 인기 있는 종목이 무엇인지 한눈에 보기 쉬워집니다! 

 

 

 마지막으로 데이터들에서 여자의 데이터만 뽑으려면 어떻게 해야 할까요? 이전에 배웠듯이 DataFrame에서 Female에 해당하는 Columns Series를 선택한 후 plot함수를 사용해주면 됩니다. (여기서 df['Female']은 Series입니다!) 또는 df.plot()을 사용하되 y = 'Female'을 입력해 주면 Female Columns의 값으로만 그래프가 그려집니다!

 

Female의 데이터만 사용

 +) 추가로 DataFrame에 여러 데이터가 섞여 있다면,  아래와 같이 x에는 가로축에 들어갈 column 이름을, y에는 세로로 표현하고 싶은 column 이름을 정해주면 됩니다.

 df.plot(kind='bar', x='x_column_name', y='y_column_name')

 

 

 위 사진과 같이 Y축은 Female에 따라서 178, 289, 98 순으로 막대그래프가 그려지는데요, X축에는 Male의 값이 들어가게 되었습니다.

728x90
반응형

'Python > Data Science' 카테고리의 다른 글

Data Science - 시각화 (4)  (0) 2021.09.05
Data Science - 시각화 (3)  (0) 2021.08.29
Data Science - 시각화 (1)  (0) 2021.08.20
Python - Data Frame 다루기 간단 정리  (0) 2021.08.16
Python - Series 다루기  (0) 2021.08.10

댓글