5) 딥러닝 학습방법 신경망 선형모델과 비선형함수의 결합 선형모델 O(n x p) = XW + b X(데이터 행렬, n x d) W(가중치행렬, d x p) b(절편, n x p) softmax 분류문제 해결에 이용하는 연산자 확률벡터 형태로 클래스 분류 학습할 때 사용 추론할 떄는 one-hot vector 사용 numpy overflow numpy는 너무 큰 값을 받을 때 overflow가 발생하므로 np.max를 활용해 해결 활성화함수 신경망은 선형모델과 활성함수(activation function)를 합성한 함수 자신의 노드에만 관여(softmax와는 다름) 활성화함수가 없다면 선형모델임 sigmoid 함수 tanh 함수 ReLU 함수 (max{0, x}) 다층 신경망 multi-layer per..