본문 바로가기
Python/Data Science

Python - Data Frame 다루기 간단 정리

by hooni40 2021. 8. 16.
728x90
반응형

 문제를 풀면서 헷갈린 것들은 정리.

 

-. Data Frame에서 원하는 값만 변경하는 방법: df.loc[조건1 & 조건2, “column이름”] = “변경 값”

적용 예시) 학년이 3학년이고, 성별이 남자인 학생의 취미(Column, Hobby)를 축구로 바꿔라 (Data Frame은 df)

boolean1 = df['grade'] == 3

boolean2 = df['gender'] == male

df.loc[boolean1 & boolean2, "Hobby"] = 'Soccer'

 

-. Series.value_counts()리턴 값은 Series이고 Series.index를 사용하면 인덱스 값을 반환 [여기서 인덱스 = Row!]

-. list(Series.index)를 하면 Series의 Index값들을 파이썬 리스트로 만들어 줌 

적용 예시) 수강 신청시 산청 가능한 강의당 신청인원수 구하기 (5명보다 많고 15명보다 적으면 추가모집)

allowed = df["status"] == "allowed"  // status가 allowed인 것들 모아서 지정course_counts = df.loc[allowed, "course name"].value_counts()  // allowed인것들에서 "course name"을 countextend_course = list(course_counts[(15> course_counts) & (course_counts >5)].index) // 조건을 만족하는 강좌들의 인덱스를 리스트로 바꿔줌)

 

for course in extend_course:    df.loc[(df["course name"] == course) & allowed, "Else") = "Extend" // 반복문을 활용하여 extend_course 내부의 course를 신청한 학생들의 "Else"열을 "Extend"로 바꿔줌!

 

 

Series와 Data Frame에 대해 공부하고 정리했는데 확실히 응용할 때 많이 부족하다는 것을 께달았다.. 시간 날 때마다 복습을 해야겠다..

 

728x90
반응형

'Python > Data Science' 카테고리의 다른 글

Data Science - 시각화 (2)  (0) 2021.08.22
Data Science - 시각화 (1)  (0) 2021.08.20
Python - Series 다루기  (0) 2021.08.10
Python - Data Frame 다루기  (0) 2021.08.04
Python - Data Frame Index/Column 수정하기  (0) 2021.08.01

댓글