본문 바로가기
728x90

data frame8

Python - Data Frame 다루기 간단 정리 문제를 풀면서 헷갈린 것들은 정리. -. Data Frame에서 원하는 값만 변경하는 방법: df.loc[조건1 & 조건2, “column이름”] = “변경 값” 적용 예시) 학년이 3학년이고, 성별이 남자인 학생의 취미(Column, Hobby)를 축구로 바꿔라 (Data Frame은 df) boolean1 = df['grade'] == 3 boolean2 = df['gender'] == male df.loc[boolean1 & boolean2, "Hobby"] = 'Soccer' -. Series.value_counts()의 리턴 값은 Series이고 Series.index를 사용하면 인덱스 값을 반환 [여기서 인덱스 = Row!] -. list(Series.index)를 하면 Series의 Inde.. 2021. 8. 16.
Python - Data Frame 다루기 안녕하세요, 이제까지 다뤘던 Data Frame들은 나름 작은 수의 Index와 Row들로 구성되어 있었습니다. 이제 많은 수의 Index 및 Row를 갖는 Data Frame들을 어떻게 다룰지 살펴보겠습니다. 아래 표는 167개의 Index들과 15개의 Column으로 이루어진 Data Frame인데요 Jupyter notebook에서 출력 시 Index가 너무 많아 중간에 ...으로 생략이 된 것을 확인할 수 있습니다. 우선 첫 번째로 위에서부터 원하는 수만큼의 index를 출력하는 방법은 head함수를 사용하는 것입니다. 반대로 아래에서 원하는 수만큼의 index를 출력하려면 head의 반대인 tail함수를 사용해주면 됩니다! 어떠한 Data Frame을 받았을 때 해당 Data Frame의 모양과.. 2021. 8. 4.
Python - Data Frame Index/Column 수정하기 안녕하세요, 오늘은 Data Frame에서 Index와 Column을 수정하는 방법을 정리하려 합니다. 먼저 Column을 바꾸는 방법은 rename함수를 사용해 수정할 수 있습니다. df.rename(columns={Column 이름:바꾸고자 하는 Column 이름})을 사용하면 되는데요, 첫 파라미터로 column을 수정하기 때문에 columns를 넣고 뒤에 기존 Column 이름과 바꾸고자 하는 Column 이름을 적어줍니다. 위의 코드를 이용해 position을 Position으로 바꿨습니다. 그런데 여기서 df를 이용해 출력을 하면 position 그대로 출력이 됩니다. 이전 시간에 정리한 inplace를 사용해야 Position이 유지됩니다. 아래 이미지와 같이 inplace=True를 추가하.. 2021. 8. 1.
Python - Data Frame 값 추가/삭제 지난 시간에는 Data Frame 내부의 값을 변경하는 방법을 정리하였습니다. 오늘은 Data Frame에 새로운 Column이나 Row를 추가 및 삭제해주는 방법을 정리하겠습니다. 새로운 Row 또는 Column을 추가하는 방법은 아주 간단한데요, Row(Index)는 loc함수를 사용하여 새로운 Index를 지정하고 리스트를 사용해서 Column 수에 맞는 내부 값을 설정해주면 됩니다! Column을 추가하는 방법도 마찬가지로 새로운 Column을 지정하여 값을 설정해주면 추가가 됩니다. 이해하기 쉽도록 아래 예를 살펴보겠습니다. 이제 반대로 기존의 Data Frame에 존재하던 Row 또는 Column을 삭제하는 방법을 살펴보겠습니다. drop함수를 사용해서 삭제가 가능한데요, DataFrame.d.. 2021. 7. 30.