Python에서는
Matrix와 Vector와 같은 Array 연산을 활용한 데이터분석을 위해
NumPy 라이브러리를 활용할 수 있다.
※ NumPy : Numerical Python
Pandas, Matplotlib의 기반이 되는 파워풀한 라이브러리이다.
Numpy 라이브러리 활용
※ 참고. NumPy 깃허브 링크 : https://github.com/numpy/numpy
NumPy 라이브러리는 주로
Python의 List에 비해 효율적으로 메모리를 사용하고(처리가 빠름)
반복문을 사용하지 않고 배열(Array)에 대한 처리가 가능한 특징이 있다.
(1) NumPy 라이브러리 설치
>> activate ml_scratch
>> conda install numpy
(2) NumPy 라이브러리 호출
>> import numpy (as np)
→ (as np)는 numpy를 호출시 별칭(Alias) 지정
(3) 배열(Array) 생성
Python에서 리스트를 잘 이해하고 있다면,
어려움 없이 NumPy에서 사용하는 Array를 생성, 수정 가능하다.
(3)-1 리스트로 생성
>> array명 = np.array([1, 2, 3, 4], float)
>> array명 = np.array([[1, 2, 3], [4, "5", "6"]])
...
(3)-2 균일값으로 생성
(x를 n개 요소로 하는 배열 생성)
>> array명 = np.full(n, x)
(3)-3 연속적인 수의 배열 생성(1)
0부터 n-1까지의 배열 생성
>> array명 = np.arange(n)
(3)-4 연속적인 수의 배열 생성(2)
n부터 m-1까지의 배열 생성
>> array명 = np.arange(n, m)
(3)-5 연속적인 수의 배열 생성(3)
n부터 m-1까지의 값 중 간격이 s인 요소들로 배열 생성
>> array명 = np.arange(n, m, s)
(3)-6 0인 요소가 n개인 배열 생성
>> array명 = np.zeros(n, dtype=int)
(3)-7 1인 요소가 n개인 배열 생성
>> array명 = np.ones(n, dtype=int)
(3)-8 비어있는 배열 생성
>> array명 = np.empty(shape=(x, y), dtype=np.int8)
*Memory initialization (x)
(3)-9 단위행렬(n1×n1) 생성
>> np.identity(n=n1, dtype=np.int8)
(3)-10 대각선이 1인 행렬
>> np.eye(N=n, M=m, dtype=np.int8)
또는
>> np.eye(n, m, k=x)
*k = 시작인덱스(start index)(변경가능)
(3)-11 랜덤인 요소가 n개인 배열 생성
>> array명 = np.random.random(n)
ex) array1 = np.random.random(4)
[0.45861856 0.98412456 0.74515612 0.14523678]
(3)-12 데이터 형변환
>> array명 = np.array([1, 2, 3, "4"], float)
string타입의 데이터를 입력해도 float타입으로 자동 형변환 실시
'DEV' 카테고리의 다른 글
[Data Science] NumPy 라이브러리 활용하기(3) (0) | 2022.04.05 |
---|---|
[Data Science] NumPy 라이브러리 활용하기(2) (0) | 2022.04.05 |
댓글