본문 바로가기

DATA SCIENCE/DEEP LEARNING

[Deep Learning] 기울기 소실과 폭주 (Gradient Vanishing & Exploding) 방지하기

이 포스트는 위키독스의 딥러닝을 이용한 자연어 처리 입문을 기반으로 작성되었습니다.

이번에는 기울기(Gradient)가 사라지거나 폭주할 때를 막아주는 방법인 Gradient Clipping, 가중치 초기화(Weight Initialization), 배치 정규화(Batch normalization), 층 정규화(Layer normalization) 등에 대해 알아보고자 한다.

반응형