본문 바로가기
DEV

[Data Science] NumPy 라이브러리 활용하기(1)

by 올커 2022. 4. 5.

Python에서는

Matrix와 Vector와 같은 Array 연산을 활용한 데이터분석을 위해

NumPy 라이브러리를 활용할 수 있다.

※ NumPy : Numerical Python

 

Pandas, Matplotlib의 기반이 되는 파워풀한 라이브러리이다.

 Numpy 라이브러리 활용


※ 참고. NumPy 깃허브 링크 : https://github.com/numpy/numpy

 

GitHub - numpy/numpy: The fundamental package for scientific computing with Python.

The fundamental package for scientific computing with Python. - GitHub - numpy/numpy: The fundamental package for scientific computing with Python.

github.com

NumPy 라이브러리는 주로

Python의 List에 비해 효율적으로 메모리를 사용하고(처리가 빠름)

반복문을 사용하지 않고 배열(Array)에 대한 처리가 가능한 특징이 있다. 

 

(1) NumPy 라이브러리 설치

>> activate ml_scratch

>> conda install numpy

 

(2) NumPy 라이브러리 호출

>> import numpy (as np)

→ (as np)는 numpy를 호출시 별칭(Alias) 지정 

 

(3) 배열(Array) 생성

Python에서 리스트를 잘 이해하고 있다면,

어려움 없이 NumPy에서 사용하는 Array를 생성, 수정 가능하다.

 

(3)-1 리스트로 생성

>> array명 = np.array([1, 2, 3, 4], float)

>> array명 = np.array([[1, 2, 3], [4, "5", "6"]])

...

 

(3)-2 균일값으로 생성

(x를 n개 요소로 하는 배열 생성)

>> array명 =  np.full(n, x)

 

(3)-3 연속적인 수의 배열 생성(1)

0부터 n-1까지의 배열 생성

>> array명 = np.arange(n)

 

(3)-4 연속적인 수의 배열 생성(2)

n부터 m-1까지의 배열 생성

>> array명 = np.arange(n, m)

 

(3)-5 연속적인 수의 배열 생성(3)

n부터 m-1까지의 값 중 간격이 s인 요소들로 배열 생성

>> array명 = np.arange(n, m, s)

 

(3)-6 0인 요소가 n개인 배열 생성

>> array명 = np.zeros(n, dtype=int)

 

(3)-7 1인 요소가 n개인 배열 생성

>> array명 = np.ones(n, dtype=int)

 

(3)-8 비어있는 배열 생성

>> array명 = np.empty(shape=(x, y), dtype=np.int8)

*Memory initialization (x)

 

(3)-9 단위행렬(n1×n1) 생성

>> np.identity(n=n1, dtype=np.int8)

 

(3)-10 대각선이 1인 행렬

>> np.eye(N=n, M=m, dtype=np.int8)

또는

>> np.eye(n, m, k=x)

*k = 시작인덱스(start index)(변경가능)

 

(3)-11 랜덤인 요소가 n개인 배열 생성

>> array명 = np.random.random(n)

ex) array1 = np.random.random(4)

[0.45861856 0.98412456 0.74515612 0.14523678]

 

(3)-12 데이터 형변환

>> array명 = np.array([1, 2, 3, "4"], float)

string타입의 데이터를 입력해도 float타입으로 자동 형변환 실시

반응형

댓글