본문 바로가기
728x90

전체 글104

DataFrame indexing (1) 안녕하세요, 지난 시간까지 Numpy, Pandas 등 Pyhton에서 Data Science를 하기 위한 Tool들을 정리하였습니다. 오늘은 DataFrame을 indexing 하는 방법에 대해 정리해보겠습니다. indexing(인덱싱)이란 데이터를 선택하는 것을 의미합니다. 우선 아래와 같은 DataFrame이 있다고 가정을 하겠습니다. (DataFrame의 이름은 iphone_df라고 가정하겠습니다. 한 가지 복습을 하고 넘어가자면 지난 시간에 정리하였듯이 index_col을 이용해 iPhone의 이름이 index의 이름이 되도록 만들었습니다. 위의 DataFrame에서 iPhone 8의 메모리가 몇인지 불러오는 인덱싱을 해보겠습니다. loc이라는 함수를 이용하여 불러올 수가 있는데요, loc[in.. 2021. 7. 24.
Python - Pandas (3) 안녕하세요, 지난 시간에는 Data Frame을 만드는 여러 가지 방법에 대해 정리해보았습니다. 2차원 리스트, Dictionary, Pandas의 Series함수로 만든 ndarray 등 여러 방법으로 만들어 보았습니다. 오늘은 Pandas의 데이터 타입과 데이터를 불러오는 방법에 대해 정리해 보겠습니다. pandas의 DataFrame에는 여러 종류의 데이터들을 담을 수 있는데요, dtypes를 사용하면 각 Column에 어떤 데이터 타입이 있는지 확인할 수 있습니다. 위의 예제에서는 'name' column은 object라는 데이터 타입을 보관하고, 'english_score' / 'math_score'는 int64라는 데이터 타입을 보관하고 있습니다. 가장 아래의 dtype: object는 Dat.. 2021. 7. 22.
Python - Pandas (2) 안녕하세요, 지난 시간에는 Pandas가 무엇인지와 Pandas 내부의 DataFrame 함수를 이용한 Data Frame을 만드는 것을 정리해 보았습니다. 이번 시간에는 다른 Data Frame을 만드는 방법을 정리해보겠습니다. 지난 시간에는 2차원 리스트를 만든 후 Pandas의 DataFrame을 이용해 만들었습니다. 아래와 같이 말이죠! import numpy as np import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list) 위의 two_dimensi.. 2021. 7. 21.
Python - Pandas (1) 안녕하세요, 지난 시간까지 Numpy 모듈에 대해 정리하면서 python의 list와 numpy의 array의 차이까지 간단히 살펴보았습니다. 오늘부터 Data Science에서 중요한 데이터 보관/ 데이터 정리/ 데이터 분석 기능을 할 수 있도록 하는 Pandas 라이브러리에 대해 정리해보겠습니다. Pandas에는 numpy의 기능과 외부에서 데이터를 읽고 쓰는 기능, 시각화하는 기능 등 다양한 기능들이 들어있습니다. 간략히 Pandas와 Numpy를 설명드리면 Numpy는 푸리에 변환과 같은 수학과 과학 연산에 특화되어 있고, Pandas의 경우 데이터 베이스(데이터 프레임)를 다루기 위한 모듈이라고 생각하시면 될 것 같습니다. Data Frame은 표형식의 데이터를 담는 자료형으로 대부분의 데이터 .. 2021. 7. 19.