본문 바로가기
Python/Data Science

Python - Numpy (1)

by hooni40 2021. 7. 15.
728x90
반응형

안녕하세요, 오늘은 python으로 데이터 분석을 하는데 꼭 필요한 numpy에 대해 정리해보겠습니다.

 

우선 numpy를 사용하기 위해서는 import numpy를 이용해 불러와야 합니다. 아래 코드를 보며 더 설명드리겠습니다.

 

 

 위 코드들이 동작하는 것을 설명드리자면 1번 Cell에서 numpy를 사용할 수 있도록 만들고 2번 Cell에서 numpy내 array함수를 이용하여 배열을 만든 후 array1 변수에 할당해 주었습니다.(3번 Cell의 결과로 array1이 배열이 출력된 것을 확인할 수 있습니다.) 5번 Cell에서 array1의 type을 확인하기 위해 type함수를 사용하면 그냥 array가 아니라 ndarray가 출력됩니다. ndarrayn-dimensional array의 약자로 n차원 배열을 뜻합니다.

 

 6번 Cell에서 shape를 통해 배열의 모양을 출력하면 11이 나오는데 뒤에 ,이 붙게 됩니다. 여기서 모양이라는 것은 행과 열을 뜻하는 것인데요, 행렬로 나타내면 1행 11열의 구조를 갖기 때문에 11만 출력이 됩니다. 여기서 (1, 11)이 아닌 (11,)가 출력되는 이유는 행이 하나일 경우 1차원으로 인식하기 때문에 11만 출력이 됩니다. 이해를 돕기 위해 리스트 안에 리스트가 또 있는 2차원 array를 만들어 설명드리겠습니다.

 

 

위의 이미지와 같이 array2는 리스트 안에 리스트들이 들어있는 2차원 리스트입니다. type함수를 사용할 경우 동일하게 ndarray가 나오며 shape함수를 사용하면 3행 4 열인 array이기 때문에 (3,4)가 출력됩니다.   

+) array 내부의 요소의 수를 나타내려면 어떻게 해야 할까요? size함수를 사용하면 됩니다!

(ex. array1.size = 11, array2.size = 12)

 

numpy 배열 제작 함수

numpy에는 여러 가지 내장 함수가 있는데요, 몇 가지만 정리해보겠습니다.

먼저 동일한 수로 이루어진 배열을 만드는 full(요소의 수, 요소)이 있으며 0으로만 이루어진 배열을 만드는 zeros, 1로만 이루어진 배열을 만드는 ones가 있습니다. 아래 이미지를 참고 부탁드립니다.

 

 

 랜덤 한 수를 만드는 random함수도 있습니다. 특이한 점은 이 random함수는 numpy모듈 안의 random모듈 안의 내장 함수이므로 실행을 시킬 때는 numpy.random.random(요소의 수)로 실행시킬 수 있습니다.

 또한 연속된 수들의 배열을 만드는 arrange함수가 있는데요, arrage는 Python의 range함수와 비슷하게 동작합니다. 예를 들어 numpy.arrage(5)를 하면 1~5까지가 아닌 0~4까지의 요소를 포함하는 배열이 생성됩니다. 마찬가지로 아래의 예를 참고해주시기 바랍니다.

 

 

728x90
반응형

'Python > Data Science' 카테고리의 다른 글

Python - Numpy (3)  (0) 2021.07.17
Python - Numpy (2)  (0) 2021.07.16
Jupyter Notebook(2)  (0) 2021.07.14
Jupyter Notebook(1)  (0) 2021.07.13
데이터 사이언스  (0) 2021.07.12

댓글