본문 바로가기
728x90

pandas9

Python - Series 다루기 안녕하세요, 지난 시간에 큰 사이즈의 Data Frame 다루는 법을 정리했습니다. 이번엔 Pandas에서 Series들을 다루는 방법에 대해 간단히 정리해보겠습니다. Data Frame에서 하나의 Column에 속한 값들을 Series라고 할 수 있는데요, Column을 뽑는 방법은 []를 사용하면 쉽게 뽑을 수 있습니다. 아래 예시를 참고해주세요. 전체 Data Frame이 위와 같이 되어있을 경우 column 중 brand만 뽑아보면 아래와 같이 나옵니다. 여기서 index가 167개가 있어 각각에 해당하는 brand를 모두 출력하지는 못하고 중간에...으로 생략이 되어있는 것을 확인할 수 있습니다. 이것을 간략하게 어떤 brand들이 있는지 확인하려면 .unique()함수를 사용하면 되고, 각각의.. 2021. 8. 10.
Python - Data Frame 다루기 안녕하세요, 이제까지 다뤘던 Data Frame들은 나름 작은 수의 Index와 Row들로 구성되어 있었습니다. 이제 많은 수의 Index 및 Row를 갖는 Data Frame들을 어떻게 다룰지 살펴보겠습니다. 아래 표는 167개의 Index들과 15개의 Column으로 이루어진 Data Frame인데요 Jupyter notebook에서 출력 시 Index가 너무 많아 중간에 ...으로 생략이 된 것을 확인할 수 있습니다. 우선 첫 번째로 위에서부터 원하는 수만큼의 index를 출력하는 방법은 head함수를 사용하는 것입니다. 반대로 아래에서 원하는 수만큼의 index를 출력하려면 head의 반대인 tail함수를 사용해주면 됩니다! 어떠한 Data Frame을 받았을 때 해당 Data Frame의 모양과.. 2021. 8. 4.
Python - Pandas (3) 안녕하세요, 지난 시간에는 Data Frame을 만드는 여러 가지 방법에 대해 정리해보았습니다. 2차원 리스트, Dictionary, Pandas의 Series함수로 만든 ndarray 등 여러 방법으로 만들어 보았습니다. 오늘은 Pandas의 데이터 타입과 데이터를 불러오는 방법에 대해 정리해 보겠습니다. pandas의 DataFrame에는 여러 종류의 데이터들을 담을 수 있는데요, dtypes를 사용하면 각 Column에 어떤 데이터 타입이 있는지 확인할 수 있습니다. 위의 예제에서는 'name' column은 object라는 데이터 타입을 보관하고, 'english_score' / 'math_score'는 int64라는 데이터 타입을 보관하고 있습니다. 가장 아래의 dtype: object는 Dat.. 2021. 7. 22.
Python - Pandas (2) 안녕하세요, 지난 시간에는 Pandas가 무엇인지와 Pandas 내부의 DataFrame 함수를 이용한 Data Frame을 만드는 것을 정리해 보았습니다. 이번 시간에는 다른 Data Frame을 만드는 방법을 정리해보겠습니다. 지난 시간에는 2차원 리스트를 만든 후 Pandas의 DataFrame을 이용해 만들었습니다. 아래와 같이 말이죠! import numpy as np import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list) 위의 two_dimensi.. 2021. 7. 21.