본문 바로가기
Python/Data Science

Data Science - 시각화 (4)

by hooni40 2021. 9. 5.
728x90
반응형

 안녕하세요, 오늘은 Box plot에 대해 정리해보겠습니다. Box Plot데이터를 표현할 때 최댓값, 최솟값, 중간 값(50% 지점) 등 여러 특성을 한 번에 그래프로 나타낼 수 있습니다.

 

 아래 그림은 제가 머신러닝을 공부하면서 강의를 듣는 코드 잇(Codeit) 자료를 가져온 것입니다. 구글 이미지보다 이해하기 쉬울 것 같아 첨부합니다.

 

Box Plot (Codeit 자료)

 

 위와 같은 Box plot으로 데이터를 해석하면 분포와 구간별 값들의 분산 정도 등을 알 수 있습니다.

 

 이제 학생별로 시험 성적 데이터를 활용하여 Box plot을 그려보겠습니다. Box plot을 그리는 방법으로는 plot함수 안에 kind='box'를 해주면 Box plot으로 그래프가 그려집니다. 원본 데이터에서 math score만 뽑고자하면 y에 math score만 적어주면 되고, 여러 데이터들을 한번에 그리고자 한다면 리스트 형식으로 y를 지정해주면 됩니다!

 

원본 Data Frame
Box Plot

 아래 그래프에서는 수학, 읽기, 쓰기 점수를 한 번에 그려서 서로 비교까지 가능하도록 그래프를 생성하였습니다.

 

728x90
반응형

댓글