본문 바로가기
728x90

data frame8

Python - Data Frame 데이터 변경하기 안녕하세요, 지난 시간까지 Data Frame에서 인덱싱을 하여 원하는 요소, Row, Column을 불러오는 여러 가지 방법에 대해 정리했습니다. 인덱싱은 Data Frame을 다루는데 꼭! 필요하므로 숙지하고 지나가야 합니다. 오늘은 Data Frame의 내용을 바꾸는 방법에 대해 정리하려 합니다. 먼저 Data Frame내의 한 가지 요소를 바꾸는 방법은 지난 시간에 배운 인덱싱을 통해 요소를 지정해주고 "="을 이용해 값을 넣어주면 됩니다! 여기서 iPhone 8의 메모리와 출시 버전을 바꿔보겠습니다! 요소의 위치를 찾을 때는 이전에 배운 인덱싱을 잘 사용해야 하므로 숙지가 덜 되셨다면 꼭 복습 후 진행하셔야 합니다! 그럼 하나의 요소가 아닌 Column과 Row를 변경하려면 어떻게 해야 할까요?.. 2021. 7. 29.
DataFrame indexing (4) 이제 드디어 Data Frame의 인덱싱 마지막 정리입니다. 이제까지의 인덱싱은 Row나 Column의 이름을 가지고 인덱싱을 하였는데요, Python의 List에서 인덱싱을 하듯 Data Frame에서도 숫자 인덱스로 인덱싱이 가능합니다! 여기서 인덱스를 이용한 위치를 찾을 때는 이제까지 사용하였던 loc이 아닌 iloc을 사용해주어야 합니다. 특정 위치의 하나의 요소를 출력하고자 할 때는 iloc[row index, col index]를 사용하여 해당 위치의 요소를 출력할 수 있습니다. 여기서 iloc[[row index1, row index2] , [col index1, col index2]]로 리스트 형식으로 넣어주면 해당 row와 col들로 이루어진 Data Frame을 출력합니다. 아래 예시를.. 2021. 7. 28.
DataFrame indexing (3) 안녕하세요, 지난 글들에서는 DataFrame의 Index와 Column을 불러오는 방법에 대해 정리해보았는데요, 오늘은 응용하여 사용하는 법에 대해 정리해보려 합니다. Numpy의 array에 Boolean값을 활용하여 출력하는 것 기억나시나요? DataFrame에서도 그것과 유사하게 sorting이 가능합니다. DataFrame의 index에 True와 False를 할당하여 True인 값만 뽑을 수 있고, column에도 동일한 방식이 적용 가능합니다. 아래 예시를 보겠습니다. column에 적용할 때는 이전 시간에 슬라이싱과 같이 row에 해당하는 위치에 :를 붙여주어야 합니다. 위의 16번 Cell에서는 df의 인덱스들 중에서 첫 번째(iPhone 7), 두 번째(iPhone 7 Plus), 다섯.. 2021. 7. 27.
Python - Pandas (1) 안녕하세요, 지난 시간까지 Numpy 모듈에 대해 정리하면서 python의 list와 numpy의 array의 차이까지 간단히 살펴보았습니다. 오늘부터 Data Science에서 중요한 데이터 보관/ 데이터 정리/ 데이터 분석 기능을 할 수 있도록 하는 Pandas 라이브러리에 대해 정리해보겠습니다. Pandas에는 numpy의 기능과 외부에서 데이터를 읽고 쓰는 기능, 시각화하는 기능 등 다양한 기능들이 들어있습니다. 간략히 Pandas와 Numpy를 설명드리면 Numpy는 푸리에 변환과 같은 수학과 과학 연산에 특화되어 있고, Pandas의 경우 데이터 베이스(데이터 프레임)를 다루기 위한 모듈이라고 생각하시면 될 것 같습니다. Data Frame은 표형식의 데이터를 담는 자료형으로 대부분의 데이터 .. 2021. 7. 19.