문제를 풀면서 헷갈린 것들은 정리.
-. Data Frame에서 원하는 값만 변경하는 방법: df.loc[조건1 & 조건2, “column이름”] = “변경 값”
적용 예시) 학년이 3학년이고, 성별이 남자인 학생의 취미(Column, Hobby)를 축구로 바꿔라 (Data Frame은 df)
boolean1 = df['grade'] == 3
boolean2 = df['gender'] == male
df.loc[boolean1 & boolean2, "Hobby"] = 'Soccer'
-. Series.value_counts()의 리턴 값은 Series이고 Series.index를 사용하면 인덱스 값을 반환 [여기서 인덱스 = Row!]
-. list(Series.index)를 하면 Series의 Index값들을 파이썬 리스트로 만들어 줌
적용 예시) 수강 신청시 산청 가능한 강의당 신청인원수 구하기 (5명보다 많고 15명보다 적으면 추가모집)
allowed = df["status"] == "allowed" // status가 allowed인 것들 모아서 지정course_counts = df.loc[allowed, "course name"].value_counts() // allowed인것들에서 "course name"을 countextend_course = list(course_counts[(15> course_counts) & (course_counts >5)].index) // 조건을 만족하는 강좌들의 인덱스를 리스트로 바꿔줌)
for course in extend_course: df.loc[(df["course name"] == course) & allowed, "Else") = "Extend" // 반복문을 활용하여 extend_course 내부의 course를 신청한 학생들의 "Else"열을 "Extend"로 바꿔줌!
Series와 Data Frame에 대해 공부하고 정리했는데 확실히 응용할 때 많이 부족하다는 것을 께달았다.. 시간 날 때마다 복습을 해야겠다..
'Python > Data Science' 카테고리의 다른 글
Data Science - 시각화 (2) (0) | 2021.08.22 |
---|---|
Data Science - 시각화 (1) (0) | 2021.08.20 |
Python - Series 다루기 (0) | 2021.08.10 |
Python - Data Frame 다루기 (0) | 2021.08.04 |
Python - Data Frame Index/Column 수정하기 (0) | 2021.08.01 |
댓글