✅ 은닉 상태는 순환 신경망(RNN) 계열 모델에서 과거의 정보를 요약해서 저장하고 있는 메모리입니다. 🧠 각 시점마다 새로운 입력()과 이전 시점의 은닉 상태()를 결합하여 현재 시점의 은닉 상태()를 계산하고, 이 새로운 은닉 상태는 다음 단계로 전달돼요.
📝 은닉 상태의 역할
은닉 상태는 마치 **사람의 '단기 기억'**과 같아요. 🧠
- 정보 요약: 은닉 상태는 문장이나 시계열 데이터 같은 순차적인 데이터에서 지금까지 본 모든 내용을 요약한 **'콘텍스트(Context)'**를 담고 있습니다. 📜
- 정보 전달: 이 요약된 정보를 다음 단계로 전달하여, 모델이 현재 시점의 입력뿐만 아니라 과거의 정보까지 고려해서 다음 예측을 할 수 있도록 도와줍니다.
예를 들어, "나는 사과를 먹고 싶다"라는 문장을 처리할 때, '나는'을 처리한 후의 은닉 상태에는 '주어가 나'라는 정보가 담겨 있고, 이 정보가 '사과'를 처리할 때 함께 사용되어 문장의 의미를 파악하는 데 도움을 줍니다. 🍏
🎨 쉬운 비유
은닉 상태는 마치 소설을 읽을 때 머릿속에 남는 줄거리 요약과 같아요. 📚
- 소설 한 문장(입력): "그는 어두운 숲 속을 걸어갔다."
- 줄거리 요약(은닉 상태): "주인공이 숲에 있음."
- 다음 문장(새로운 입력): "갑자기 사나운 늑대가 나타났다."
- 업데이트된 줄거리(새로운 은닉 상태): "주인공이 숲에서 늑대를 만남."
이처럼 은닉 상태는 이전까지의 내용을 요약해서 기억하고, 새로운 정보가 들어올 때마다 업데이트되면서 전체적인 이야기의 흐름을 놓치지 않게 해주는 역할을 합니다. 🌲🐺
'AI 엔지니어준비' 카테고리의 다른 글
| ❓ 딥러닝 모델의 성능을 향상시키기 위해 조정하는 하이퍼파라미터의 종류 (0) | 2025.09.08 |
|---|---|
| ❓ 딥러닝과 머신러닝의 관계? (0) | 2025.09.08 |
| ❓ LSTM(Long Short-Term Memory) GRU(Gated Recurrent Unit) 사이의 연관 관계에 대해 (0) | 2025.09.05 |
| ❓ 부스팅이란 어떤 앙상블 모델인지?, AdaBoost 이외의 부스팅 모델에는 무엇이 있는지? (1) | 2025.08.28 |
| ❓ 결정 트리의 장점과 단점에 대해 (4) | 2025.08.28 |