728x90 히스토그램2 통계학 기초 - 선형관계측도 및 탐색적 Data 분석(시각화) 선형 관계 측도 세상의 대부분 결과(예측 변수 등)는 하나의 변수에 의해 결정되지 않습니다. 이러한 상관관계를 표현하는 방식은 여러 개가 있는데요, 대표적으로 두 개의 연속형 변수 X와 Y 사이의 선형관계를 파악하고자 할 때 사용하는 게 표본 상관 계수입니다. 피어슨 상관 계수라고도 부릅니다. 위의 식을 간략히 설명드리면 두 변수의 공분산을 각 변수들의 표준편차의 곱으로 나눈 것입니다. 𝛄는 -1에서 1 사이의 값을 가지고, -1이면 높은 음의 상관관계를 가지고 1이면 높은 양의 상관관계를 가집니다. 0일 경우 상관관계가 없을 수도 있지만 비선형 상관관계를 가질 수도 있기에 산점도와 같은 시각화를 함께 확인해야 합니다. 탐색적 Data 분석(시각화) 평균, 중앙값과 같은 수치로만 데이터 분석을 하기에는 .. 2024. 3. 31. Data Science - 시각화 (3) 안녕하세요, 지난 시간까지 선 그래프, 막대그래프에 대해 정리하였습니다. 오늘은 파이 그래프, 히스토그램에 대해 정리해보겠습니다. 우선 파이 그래프는 투표와 같이 요소별로 몇 표가 받았는지 보다 전체 중에 얼마나 차지하고 있는지에 대해 확인할 때 유용합니다. 그리는 법은 plot 함수 안에 kind='pie'만 해주면 되는데요, 파이 그래프는 index를 기준으로 이름표를 붙이게 됩니다. 위의 그래프는 2017년에 각 방송사별 시청률을 파이 그래프로 나타낸 것인데요, 그럼 MBN 방송국의 연도별 시청률은 어떻게 될까요? 'MBN' Column에 plot함수를 사용해주면 쉽게 나타낼 수 있습니다! 다음으로는 히스토그램에 대해 정리해보겠습니다. 선그래프는 변화에 대해 볼 때 유용하고, 막대그래프는 항목들의 .. 2021. 8. 29. 이전 1 다음