본문 바로가기
728x90

Jupyter Notebook4

Data Science - 시각화 (1) 안녕하세요, 면접 후유증 및 회사일로 인해 공부할 시간이 줄어들어 오랜만에 글을 적습니다. 이전 시간까지 Data Frame을 다루는 법에 대해 정리하였었는데요, 오늘부터는 시각화에 대해 정리하려 합니다. Data Science에서 시각화는 직관성을 올려줍니다. 시각화의 장점으로는 그래프로 볼 경우 테이블보다 패턴이 잘 보이므로 분석에 도움이 되고, 그래프에서는 이상점(Outlier)과 같은 문제점이 쉽게 보입니다. 테이블보다 그래프가 직관적인 예시를 하나 보고 넘어가겠습니다. 연도별 방송사의 시청률을 나타낸 테이블을 그래프로 변환해 보았습니다. 아래를 보시면 테이블을 보고 해석하는 것보다 그래프를 보는 순간 KBS의 시청률이 가장 높고 시간이 지날수록 떨어지고 있구나라는 것을 직관적으로 알 수 있습니다.. 2021. 8. 20.
DataFrame indexing (4) 이제 드디어 Data Frame의 인덱싱 마지막 정리입니다. 이제까지의 인덱싱은 Row나 Column의 이름을 가지고 인덱싱을 하였는데요, Python의 List에서 인덱싱을 하듯 Data Frame에서도 숫자 인덱스로 인덱싱이 가능합니다! 여기서 인덱스를 이용한 위치를 찾을 때는 이제까지 사용하였던 loc이 아닌 iloc을 사용해주어야 합니다. 특정 위치의 하나의 요소를 출력하고자 할 때는 iloc[row index, col index]를 사용하여 해당 위치의 요소를 출력할 수 있습니다. 여기서 iloc[[row index1, row index2] , [col index1, col index2]]로 리스트 형식으로 넣어주면 해당 row와 col들로 이루어진 Data Frame을 출력합니다. 아래 예시를.. 2021. 7. 28.
Jupyter Notebook(2) 지난 시간에는 Jupyter Notebook 설치 및 실행에 대해 정리했습니다. 이번엔 Jupyter notebook의 기능에 대해 정리해보겠습니다. Jupyter notebook을 실행한 후에 New 메뉴에서 Python3을 누르면 새로운 file이 생성됩니다. 새로 생성된 노트의 내부 구조를 대략 확인해보겠습니다(Help-User Interface Tour를 누르면 좀 더 자세히 확인 가능) 여기서 Mode에는 두 가지가 있는데요, 하나는 Command Mode이고 다른 하나는 Edit Mode입니다. 아무것도 없으면 Command mode이고 위 이미지와 같이 연필 모양이 있으면 Edit mode입니다! Command mode인 경우 Cell의 왼쪽이 파란색이고 Edit mode인 경우 위와 같이 .. 2021. 7. 14.
Jupyter Notebook(1) Jupyter notebook은 웹 브라우저에서 인터렉티브 하게 작업하는 Tool입니다. 웹에서 코딩하면서 그래프도 볼 수 있습니다. Jupyter notebook의 장점으로는 코드의 결과물을 바로 볼 수있고 코드를 여러 단계로 나누어 실행할 수 있으며, 마크다운 언어로 설명도 남길 수 있습니다. 단점으로는 버전 관리나 협업에 어려움이 있고 IDE에 비해 지원되는 Tool이 적습니다. 처음에 배울 때는 Jupyter Notebook으로 공부하는 게 좋다고 하여 정리하고자 합니다. ◆ Jupyter Notebook 설치 및 실행 -. 아나콘다라는 프로그램을 설치하면 Jupyter Notebook과 Python이 자동으로 설치됩니다. 아나콘다 홈페이지로 들어가서 Window용으로 설치합니다. 설치 과정 중 .. 2021. 7. 13.