본문 바로가기
728x90

Data Science11

Python - Pandas (3) 안녕하세요, 지난 시간에는 Data Frame을 만드는 여러 가지 방법에 대해 정리해보았습니다. 2차원 리스트, Dictionary, Pandas의 Series함수로 만든 ndarray 등 여러 방법으로 만들어 보았습니다. 오늘은 Pandas의 데이터 타입과 데이터를 불러오는 방법에 대해 정리해 보겠습니다. pandas의 DataFrame에는 여러 종류의 데이터들을 담을 수 있는데요, dtypes를 사용하면 각 Column에 어떤 데이터 타입이 있는지 확인할 수 있습니다. 위의 예제에서는 'name' column은 object라는 데이터 타입을 보관하고, 'english_score' / 'math_score'는 int64라는 데이터 타입을 보관하고 있습니다. 가장 아래의 dtype: object는 Dat.. 2021. 7. 22.
Python - Pandas (2) 안녕하세요, 지난 시간에는 Pandas가 무엇인지와 Pandas 내부의 DataFrame 함수를 이용한 Data Frame을 만드는 것을 정리해 보았습니다. 이번 시간에는 다른 Data Frame을 만드는 방법을 정리해보겠습니다. 지난 시간에는 2차원 리스트를 만든 후 Pandas의 DataFrame을 이용해 만들었습니다. 아래와 같이 말이죠! import numpy as np import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list) 위의 two_dimensi.. 2021. 7. 21.
Python - Numpy (3) 안녕하세요, 지난 시간에는 numpy모듈을 사용하여 편리하게 배열을 만들어 보고 배열 내 요소들을 변경해보았습니다. 오늘은 이어서 numpy를 사용하여 추가적으로 할 수 있는 것을 정리해보겠습니다. 지난 시간처럼 numpy로 만든 배열에 덧셈, 곱셈, 나눗셈 등을 할 수도 있지만 논리식을 이용하여 True/False를 판별할 수도 있습니다. 또한 numpy모듈의 where함수를 사용한다면 True/False로 구성된 array에서 True인 요소들의 인덱스만 추출할 수도 있습니다. 위의 예시를 보시면 array1에 논리식(대소 관계나 나머지 등)을 줌으로써 요소가 논리식을 만족하는지 확인이 가능합니다. 또한 5번에서 True/False로 이루어진 Array에 Where함수를 사용함으로써 True의 인덱스.. 2021. 7. 17.