본문 바로가기
728x90

Python38

Python - Series 다루기 안녕하세요, 지난 시간에 큰 사이즈의 Data Frame 다루는 법을 정리했습니다. 이번엔 Pandas에서 Series들을 다루는 방법에 대해 간단히 정리해보겠습니다. Data Frame에서 하나의 Column에 속한 값들을 Series라고 할 수 있는데요, Column을 뽑는 방법은 []를 사용하면 쉽게 뽑을 수 있습니다. 아래 예시를 참고해주세요. 전체 Data Frame이 위와 같이 되어있을 경우 column 중 brand만 뽑아보면 아래와 같이 나옵니다. 여기서 index가 167개가 있어 각각에 해당하는 brand를 모두 출력하지는 못하고 중간에...으로 생략이 되어있는 것을 확인할 수 있습니다. 이것을 간략하게 어떤 brand들이 있는지 확인하려면 .unique()함수를 사용하면 되고, 각각의.. 2021. 8. 10.
Python - Data Frame 다루기 안녕하세요, 이제까지 다뤘던 Data Frame들은 나름 작은 수의 Index와 Row들로 구성되어 있었습니다. 이제 많은 수의 Index 및 Row를 갖는 Data Frame들을 어떻게 다룰지 살펴보겠습니다. 아래 표는 167개의 Index들과 15개의 Column으로 이루어진 Data Frame인데요 Jupyter notebook에서 출력 시 Index가 너무 많아 중간에 ...으로 생략이 된 것을 확인할 수 있습니다. 우선 첫 번째로 위에서부터 원하는 수만큼의 index를 출력하는 방법은 head함수를 사용하는 것입니다. 반대로 아래에서 원하는 수만큼의 index를 출력하려면 head의 반대인 tail함수를 사용해주면 됩니다! 어떠한 Data Frame을 받았을 때 해당 Data Frame의 모양과.. 2021. 8. 4.
Python - Data Frame Index/Column 수정하기 안녕하세요, 오늘은 Data Frame에서 Index와 Column을 수정하는 방법을 정리하려 합니다. 먼저 Column을 바꾸는 방법은 rename함수를 사용해 수정할 수 있습니다. df.rename(columns={Column 이름:바꾸고자 하는 Column 이름})을 사용하면 되는데요, 첫 파라미터로 column을 수정하기 때문에 columns를 넣고 뒤에 기존 Column 이름과 바꾸고자 하는 Column 이름을 적어줍니다. 위의 코드를 이용해 position을 Position으로 바꿨습니다. 그런데 여기서 df를 이용해 출력을 하면 position 그대로 출력이 됩니다. 이전 시간에 정리한 inplace를 사용해야 Position이 유지됩니다. 아래 이미지와 같이 inplace=True를 추가하.. 2021. 8. 1.
Python - Data Frame 값 추가/삭제 지난 시간에는 Data Frame 내부의 값을 변경하는 방법을 정리하였습니다. 오늘은 Data Frame에 새로운 Column이나 Row를 추가 및 삭제해주는 방법을 정리하겠습니다. 새로운 Row 또는 Column을 추가하는 방법은 아주 간단한데요, Row(Index)는 loc함수를 사용하여 새로운 Index를 지정하고 리스트를 사용해서 Column 수에 맞는 내부 값을 설정해주면 됩니다! Column을 추가하는 방법도 마찬가지로 새로운 Column을 지정하여 값을 설정해주면 추가가 됩니다. 이해하기 쉽도록 아래 예를 살펴보겠습니다. 이제 반대로 기존의 Data Frame에 존재하던 Row 또는 Column을 삭제하는 방법을 살펴보겠습니다. drop함수를 사용해서 삭제가 가능한데요, DataFrame.d.. 2021. 7. 30.