NumPy 라이브러리란?

NumPy(넘파이, Numerical Python)는 파이썬에서 과학 계산 및 데이터 분석을 위한 대표적인 라이브러리입니다. 다차원 배열 객체인 ndarray를 제공하며, 수학 연산 및 행렬 연산을 효율적으로 수행할 수 있도록 최적화되어 있습니다.

🔹 NumPy 설치 방법

pip install numpy

🔹 NumPy 기본 사용법

1. NumPy 라이브러리 불러오기

import numpy as np

2. NumPy 배열 생성

arr = np.array([1, 2, 3, 4, 5])
print(arr) # [1 2 3 4 5]
print(type(arr)) # <class 'numpy.ndarray'>

3. 다차원 배열 생성

arr_2d = np.array([[1, 2, 3], [4, 5, 6]])
print(arr_2d)

출력:

[[1 2 3]
[4 5 6]]

4. 기본 배열 생성 함수

print(np.zeros((3, 3)))  # 3x3 영행렬
print(np.ones((2, 4))) # 2x4 행렬 (모든 값이 1)
print(np.full((2, 2), 7)) # 모든 값이 7인 2x2 행렬
print(np.eye(3)) # 3x3 단위 행렬
print(np.arange(0, 10, 2)) # [0 2 4 6 8]
print(np.linspace(0, 1, 5)) # 0과 1 사이를 5등분한 배열

🔹 NumPy 배열 연산

1. 기본 연산

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

print(a + b) # [5 7 9]
print(a - b) # [-3 -3 -3]
print(a * b) # [4 10 18]
print(a / b) # [0.25 0.4 0.5]

2. 브로드캐스팅(Broadcasting)

A = np.array([[1, 2], [3, 4]])
B = np.array([10, 20])

print(A + B)
# [[11 22]
# [13 24]]
  • 브로드캐스팅이란 크기가 다른 배열을 자동으로 맞춰서 연산하는 기능입니다.

3. 행렬 연산

A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

print(A @ B) # 행렬 곱셈
print(np.dot(A, B)) # 같은 행렬 곱셈 결과

4. 유용한 수학 함수

arr = np.array([1, 2, 3, 4, 5])

print(np.sum(arr)) # 합계: 15
print(np.mean(arr)) # 평균: 3.0
print(np.max(arr)) # 최댓값: 5
print(np.min(arr)) # 최솟값: 1
print(np.std(arr)) # 표준편차
print(np.sqrt(arr)) # 제곱근

🔹 NumPy 배열 인덱싱 & 슬라이싱

arr = np.array([10, 20, 30, 40, 50])

print(arr[1]) # 20
print(arr[1:4]) # [20 30 40]
print(arr[:3]) # [10 20 30]
print(arr[::-1]) # [50 40 30 20 10] (거꾸로 출력)

2차원 배열에서 특정 요소 선택

arr_2d = np.array([[10, 20, 30], [40, 50, 60]])

print(arr_2d[0, 1]) # 20 (0번째 행, 1번째 열)
print(arr_2d[:, 1]) # [20 50] (모든 행의 1번째 열)
print(arr_2d[1, :]) # [40 50 60] (1번째 행의 모든 열)

🔹 NumPy 응용 예제

1. 난수 생성

np.random.seed(42)  # 시드 고정 (결과 일관성 유지)
print(np.random.rand(3, 3)) # 0~1 사이의 난수 행렬
print(np.random.randint(1, 10, (3, 3))) # 1~10 사이의 정수 난수 행렬

2. 배열 변형 (Reshape)

arr = np.arange(1, 10)
print(arr.reshape(3, 3)) # 3x3 행렬로 변경

3. 배열 정렬

arr = np.array([3, 1, 4, 1, 5, 9])
print(np.sort(arr)) # 오름차순 정렬: [1 1 3 4 5 9]

🔹 NumPy 활용 예제: 선형대수

A = np.array([[2, 3], [1, 4]])
b = np.array([5, 6])

x = np.linalg.solve(A, b) # Ax = b의 해 구하기
print(x)

🔹 NumPy와 Pandas 비교

기능NumPy (ndarray)Pandas (DataFrame)
데이터 구조다차원 배열 (ndarray)테이블 형태 (DataFrame)
속도빠름 (벡터 연산)다소 느림 (추가 기능)
사용 목적수학 계산, 머신러닝데이터 분석, 시각화
인덱싱숫자 인덱싱 사용라벨 및 숫자 인덱싱 지원

✅ NumPy는 데이터 분석과 머신러닝에서 필수적인 라이브러리입니다. ndarray를 활용한 고속 연산을 익히면 효율적인 데이터 처리가 가능합니다. 🚀

zerg96

Recent Posts

MCP(Model Context Protocol)

오늘은 AI 생태계에 혁신적인 변화를 가져올 것으로 예상되는 MCP(Model Context Protocol)에 대해 상세히 알아보겠습니다. 2024년…

1주 ago

TPM(Trusted Platform Module)

1. TPM이란? TPM(Trusted Platform Module)은 국제 표준 기반의 보안 하드웨어 칩으로, 컴퓨터나 디지털 장비 내에서…

1주 ago

BitLocker

BitLocker는 Microsoft Windows 운영 체제에 내장된 디스크 전체 암호화(Full Disk Encryption) 기능입니다. 기업 환경뿐만 아니라…

1주 ago

《데블스 플랜 시즌2》: 게임인가, 연애인가? 소희 이렇게까지..?

시즌2, 기대했는데... 실망도 두 배!두뇌싸움을 기대했는데, 전략도 없는 자기들만의 감정에 따른 편가르기, 정치싸움이 되어 버린…

2주 ago

BPF도어(BPFdoor)

BPF(Berkeley Packet Filter) 도어는 해커가 관리자 몰래 뒷문을 새로 만든 것입니다.해커가 명령을 내려 특정 데이터들을 뒷문을…

2주 ago

IPC (Inter-Process Communication)

1. IPC의 개념과 목적 1.1 IPC란 무엇인가? IPC (Inter-Process Communication)는 운영체제 내의 서로 독립적인 프로세스…

2주 ago