함수란 두 집합 간에 논리적 관계를 정의한다. 이런 함수의 종류는 다양하게 있지만 대표적인 몇가지 함수만 다룰려고 한다. 여기에서 다루는 함수는 AI 작업 중에 흔하게 마주치는 함수 위주로 나열했다.
1차, 2차 함수
1차 함수는 그래프로 그리면 직선으로 표시된다.
$$ y = ax + b ~(a,b는 ~상수, a \neq 0) $$
a가 직선 기울기, b가 절편이라고 한다.
2차 함수는 그래프로 그리면 포물선 모양이 된다.
$$ y = ax^2 + bx + c ~(a,b,c는~ 상수, ~a \neq 0) $$
a가 양수면 아래로 볼록, 음수이면 위로 볼록이 된다. 2차 함수에는 최솟값/최댓값이 존재한다.
지수 함수와 로그 함수
지수(Exponential)함수는 다음과 같은 형태이다.
$$ y = a^x (a>0, a \neq 1) $$
a가 밑이라고 하고 x가 지수에 해당한다. a가 자연상수 e를 사용한 특수한 지수함수가 있다.
$$ y = e^x = \exp(x) $$
로그(Log)함수는 지수함수에서 지수 부분을 독립적으로 표기한 형태라고 볼 수 있다. 경우에 따라 로그 형태로 표현하는게 간편하고 직관적이기 때문에 많이 사용된다. 로그 함수는 다음과 같은 형태이다.
$$ y = \log_a x ( a > 0, a \neq 1) $$
a가 밑이고 x가 진수에 해당한다. 지수 함수와 비교하면 y가 지수 함수의 지수에 해당하고 a는 지수 함수의 밑과 같고, x는 지수 함수는 y와 같다. 보통 밑인 a가 10인 경우는 생략해서 $ \log x$표기하기도 한다. a가 자연상수 e인 경우 자연로그라고 하며 $\log_e x$ 대신에 $ \ln x $으로 간편하게 표기하기도 한다. 간혹, log을 ln로 처리하는 경우도 있기에 주의가 필요하다.
로그 성질로 a > 0, a ≠ 1, X, Y>0 인경우 다음과 같다.
- $\log_a a = 1$
- $\log_a 1 = 0$
- $\log_a XY = \log_a X + \log_a Y$
- $\log_a X / Y = \log_a X - \log_a Y$
- $\log_a X^p = p \log_a X$
- $\log_a X = { \log_c X \over \log_c a }~(c > 0, c \neq 1)$
시그모이드 함수
신경망에서 가장 많이 사용하는 시그모이드(Sigmoid) 함수를 살펴보자.
$$ \sigma_a(x) = {1 \over 1 + e^{-ax}} $$
a를 게인이라고 하며 1인 경우를 표준 시그모이드 함수라고 한다.
변수가 여러 개인 경우는 편미분으로 연쇄법칙을 사용해 개별적으로 적용하여 합칠 수 있다.
삼각함수
호도법(Radian)은 삼각함수에서 각을 표현하는 방법으로 반지름과 같은 호의 길이을 가지는 각도를 1rad라고 한다.
라디안 π가 180도가 되며 360도는 라디안 2π에 해당한다.
삼각함수 간에 관계
- $\tan \theta = {\sin \theta \over \cos \theta}$
- $\sin^2 \theta + \cos^2 \theta = 1$
- $1 + \tan^2 \theta = {1 \over \cos^2 \theta}$
정규분포 확률밀도함수
통계에서 가장 많이 사용하는 정규분포이다. 모든 자연적인 현상의 통계 수치 들은 정규분포를 따르기 분석할 때에 자주 쓰인다.
$$ f(x) = {1 \over \sqrt {2 \pi \sigma^2}} \exp \left( -{(x-\mu)^2 \over 2 \sigma^2} \right) $$
μ 는 기대값으로 평균에 해당하고, σ 는 표준편차이다. 그래프 모양이 종 모양과 비슷해서 벨 커브라고도 한다. 만약 기대값이 0이고 표준편차가 1인 경우 표준 정규분포라고 한다.
참고
[1] 와쿠이 요시유키, 와쿠이 사다미, 처음 배우는 딥러닝 수학, 한빛미디어
[2] 이시카와 아키히코, 신상재 이진희, 인공지능을 위한 수학, 프리렉, 2019.09.16
[3] 함수, https://namu.wiki/w/%ED%95%A8%EC%88%98, 2025.02.04
'6.수학과 알고리즘' 카테고리의 다른 글
CNN 이미지 식별 알고리즘 (0) | 2024.03.11 |
---|---|
BoF 알고리즘 (0) | 2024.03.10 |
Blockchain (4) | 2024.03.07 |
[javascript] 펜윅 트리 Fenwick tree (0) | 2023.10.20 |
나비에-스토크스(Navier-Stokes) 방정식 (0) | 2023.01.03 |