본문 바로가기
728x90

Python/Data Science25

Python - Pandas (3) 안녕하세요, 지난 시간에는 Data Frame을 만드는 여러 가지 방법에 대해 정리해보았습니다. 2차원 리스트, Dictionary, Pandas의 Series함수로 만든 ndarray 등 여러 방법으로 만들어 보았습니다. 오늘은 Pandas의 데이터 타입과 데이터를 불러오는 방법에 대해 정리해 보겠습니다. pandas의 DataFrame에는 여러 종류의 데이터들을 담을 수 있는데요, dtypes를 사용하면 각 Column에 어떤 데이터 타입이 있는지 확인할 수 있습니다. 위의 예제에서는 'name' column은 object라는 데이터 타입을 보관하고, 'english_score' / 'math_score'는 int64라는 데이터 타입을 보관하고 있습니다. 가장 아래의 dtype: object는 Dat.. 2021. 7. 22.
Python - Pandas (2) 안녕하세요, 지난 시간에는 Pandas가 무엇인지와 Pandas 내부의 DataFrame 함수를 이용한 Data Frame을 만드는 것을 정리해 보았습니다. 이번 시간에는 다른 Data Frame을 만드는 방법을 정리해보겠습니다. 지난 시간에는 2차원 리스트를 만든 후 Pandas의 DataFrame을 이용해 만들었습니다. 아래와 같이 말이죠! import numpy as np import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list) 위의 two_dimensi.. 2021. 7. 21.
Python - Pandas (1) 안녕하세요, 지난 시간까지 Numpy 모듈에 대해 정리하면서 python의 list와 numpy의 array의 차이까지 간단히 살펴보았습니다. 오늘부터 Data Science에서 중요한 데이터 보관/ 데이터 정리/ 데이터 분석 기능을 할 수 있도록 하는 Pandas 라이브러리에 대해 정리해보겠습니다. Pandas에는 numpy의 기능과 외부에서 데이터를 읽고 쓰는 기능, 시각화하는 기능 등 다양한 기능들이 들어있습니다. 간략히 Pandas와 Numpy를 설명드리면 Numpy는 푸리에 변환과 같은 수학과 과학 연산에 특화되어 있고, Pandas의 경우 데이터 베이스(데이터 프레임)를 다루기 위한 모듈이라고 생각하시면 될 것 같습니다. Data Frame은 표형식의 데이터를 담는 자료형으로 대부분의 데이터 .. 2021. 7. 19.
Python - Numpy (3) 안녕하세요, 지난 시간에는 numpy모듈을 사용하여 편리하게 배열을 만들어 보고 배열 내 요소들을 변경해보았습니다. 오늘은 이어서 numpy를 사용하여 추가적으로 할 수 있는 것을 정리해보겠습니다. 지난 시간처럼 numpy로 만든 배열에 덧셈, 곱셈, 나눗셈 등을 할 수도 있지만 논리식을 이용하여 True/False를 판별할 수도 있습니다. 또한 numpy모듈의 where함수를 사용한다면 True/False로 구성된 array에서 True인 요소들의 인덱스만 추출할 수도 있습니다. 위의 예시를 보시면 array1에 논리식(대소 관계나 나머지 등)을 줌으로써 요소가 논리식을 만족하는지 확인이 가능합니다. 또한 5번에서 True/False로 이루어진 Array에 Where함수를 사용함으로써 True의 인덱스.. 2021. 7. 17.