본문 바로가기
728x90

Python/Data Science25

DataFrame indexing (4) 이제 드디어 Data Frame의 인덱싱 마지막 정리입니다. 이제까지의 인덱싱은 Row나 Column의 이름을 가지고 인덱싱을 하였는데요, Python의 List에서 인덱싱을 하듯 Data Frame에서도 숫자 인덱스로 인덱싱이 가능합니다! 여기서 인덱스를 이용한 위치를 찾을 때는 이제까지 사용하였던 loc이 아닌 iloc을 사용해주어야 합니다. 특정 위치의 하나의 요소를 출력하고자 할 때는 iloc[row index, col index]를 사용하여 해당 위치의 요소를 출력할 수 있습니다. 여기서 iloc[[row index1, row index2] , [col index1, col index2]]로 리스트 형식으로 넣어주면 해당 row와 col들로 이루어진 Data Frame을 출력합니다. 아래 예시를.. 2021. 7. 28.
DataFrame indexing (3) 안녕하세요, 지난 글들에서는 DataFrame의 Index와 Column을 불러오는 방법에 대해 정리해보았는데요, 오늘은 응용하여 사용하는 법에 대해 정리해보려 합니다. Numpy의 array에 Boolean값을 활용하여 출력하는 것 기억나시나요? DataFrame에서도 그것과 유사하게 sorting이 가능합니다. DataFrame의 index에 True와 False를 할당하여 True인 값만 뽑을 수 있고, column에도 동일한 방식이 적용 가능합니다. 아래 예시를 보겠습니다. column에 적용할 때는 이전 시간에 슬라이싱과 같이 row에 해당하는 위치에 :를 붙여주어야 합니다. 위의 16번 Cell에서는 df의 인덱스들 중에서 첫 번째(iPhone 7), 두 번째(iPhone 7 Plus), 다섯.. 2021. 7. 27.
DataFrame indexing (2) 안녕하세요, 지난 시간에 이어 DataFrame에서 인덱 싱하는 것을 정리해보겠습니다. 간략히 지난 시간에 한 것을 정리하고 시작하겠습니다. -. DataFrame의 요소를 불러오는 것 : df.loc[Row, Column] -. DataFrame의 하나의 인덱스(Row)를 불러오는 것 : df.loc[Row] -. DataFrame의 하나의 Column을 불러오는 것 : df[Column] -. DataFrame의 여러 인덱스(Row)를 불러오는 것 : df.loc[[Row, Row]] -. DataFrame의 여러 Column을 불러오는 것 : df[[Column, Column]] 여기서 한 가지 짚고 넘어가자면 위의 예시에서 하나의 인덱스를 뽑을 때와 여러 인덱스를 뽑는 것은 데이터 타입이 다릅니다.. 2021. 7. 26.
DataFrame indexing (1) 안녕하세요, 지난 시간까지 Numpy, Pandas 등 Pyhton에서 Data Science를 하기 위한 Tool들을 정리하였습니다. 오늘은 DataFrame을 indexing 하는 방법에 대해 정리해보겠습니다. indexing(인덱싱)이란 데이터를 선택하는 것을 의미합니다. 우선 아래와 같은 DataFrame이 있다고 가정을 하겠습니다. (DataFrame의 이름은 iphone_df라고 가정하겠습니다. 한 가지 복습을 하고 넘어가자면 지난 시간에 정리하였듯이 index_col을 이용해 iPhone의 이름이 index의 이름이 되도록 만들었습니다. 위의 DataFrame에서 iPhone 8의 메모리가 몇인지 불러오는 인덱싱을 해보겠습니다. loc이라는 함수를 이용하여 불러올 수가 있는데요, loc[in.. 2021. 7. 24.