히비스서커스의 블로그

[기계학습 4강] Logistic Regression with Gradient Ascent 본문

Theory/Machine Learning

[기계학습 4강] Logistic Regression with Gradient Ascent

HibisCircus 2021. 4. 15. 23:00
728x90

 내용들은 edwith(KAIST Open Online Course)의 인공지능 및 기계학습 개론 1 Chap. 4강 내용을 기반으로 재구성하였음을 먼저 밝힙니다.

 

 

 

Finding θ with Gradient Ascent


우리는 이전에 Logistic Regression에서 

 

ˆθ=argmaxθ1iNP(Yi|Xi;θ)

 

와 같이 \theta$를 얻기 위하여 아래와 같이 

 

f(θ)=1iNlog(P(Yi|Xi;θ))

f(θ)θj=θj{1iNlog(P(Yi|Xi;θ))}=1iNXi,j(YiP(y=1|x;θ))

 

미분의 과정까지 거쳐보았다. 여기서 θ가 open form solution이었기 때문에 이를 최적화하기 위해서는 approximate한 값을 구해야했다. 그러기 위해서 우리는 Gradient Ascent방법을 적용(argmax이기 때문)할 수 있다. 이를 적용해보면

 

xt+1xt+hu=xt+hf(xt)|f(xt)|

 

임을 고려하여 

 

θt+1jθtj+hf(θt)θtj=θtj+h{1iNXi,j(YiP(Y=1|Xi;θt))}

=θt+1j+hC{1iNXi,j(YieXiθt1+eXiθt)}

(θ0j는 임의로 선택될 수 있음, C는 유닛벡터를 만들기 위해 Normalize해주는 값)

 

과 같이 된다.

 

 

 

이제 우리가 구했던 Linear Regression을 다시 살펴보자.

Linear Regression Revisited


 

이전에 우리는 

 

θ=argminθ(fˆf)2

=argminθ(YXθ)2

=argminθ(YXθ)t

=argminθ(YtθtXt)(YXθ)

=argminθYtYYtXθθtXtY+θTXTXθ

=argminθ(θtXtXθ2θtXtY+YtY),  

= argmin_{\theta} (\theta^{t} X^{t} X \theta - 2 \theta^{t} X^{t} Y), \theta입장에서는 Y^{t} Y는 상수이기 때문

 

여기서 최적의 \theta는 

 

\nabla_{\theta} (\theta^{t}X^{t}X\theta - 2\theta^{t}X^{t}Y) = 0

2X^{t}X\theta - 2X^{t}Y = 0

\theta = (X^{t}X)^{-1} X{t}Y

 

 

임을 살펴본 바가 있다.

 

 

Linear Regression에서는 closed form solution으로 더 이상 문제가 될 것이 없어보이나 X를 이루는 데이터가 커지면 문제가 될 수 있다. 왜냐하면 역행렬을 구하는 과정에서의 계산량이 매우 많이 들기 때문이다. 따라서 gradient descent 방법으로 이를 해결할 수 있는데 적용해보면

 

\theta = argmin_{\theta}(f - \hat{f})^{2} = argmin_{\theta} (Y - X \theta)^{2}

 

\frac{\partial}{\partial \theta_k} \sum_{1 \leq i \leq N} (Y^i - \sum_{1 \leq j \leq d X_{j}^{i} \theta_j})^2 = -\sum_{1 \leq i \leq N} 2(Y^i - \sum_{1 \leq j \leq d} X_{j}^{i} \theta_j) X_{k}^{i}

\theta_{k}^{t+1} \leftarrow \theta_{k}^{t} - h \frac{\partial f(\theta^t)}{\partial \theta_{k}^{t}} = \theta_{k}^{t} +\sum_{1 \leq i \leq N} 2(Y^i - \sum_{1 \leq j \leq d} X_{j}^{i} \theta_{j}) X_{k}^{i}

 

과 같이 될 수 있음을 알 수 있다.

 

 

 

-히비스서커스-

728x90