CV(시각)와 LLM(언어)이 현재 가장 핫한 '슈퍼스타'인 건 맞지만, 딥러닝의 세계는 훨씬 넓습니다.
데이터의 **형태(Input Type)**와 **목적(Task)**에 따라 크게 5가지 메이저 분야가 더 있습니다. 엔지니어 관점에서 "무엇을 입력으로 받아서 무엇을 뱉는지" 팩트 위주로 정리해 드립니다.
1. 시계열 예측 (Time Series Forecasting)
주식, 날씨, 서버 트래픽처럼 **"시간의 흐름"**이 있는 숫자를 다룹니다.
- 입력: 과거 30일치 주가 데이터 [100, 102, 98...]
- 출력: 내일의 주가 예측값 105
- 대표 모델: LSTM, GRU, 최근엔 Time-Transformer (LLM 기술을 시계열에 적용)
- 현업 활용: 수요 예측(재고 관리), 이상 탐지(공장 센서 고장 예측).
- 특이점: 아직 딥러닝보다 전통적인 통계 모델(ARIMA)이나 머신러닝(XGBoost)이 더 많이 쓰이는 분야이기도 합니다.
2. 오디오 & 음성 처리 (Audio/Speech Processing)
소리를 다룹니다. 사실상 소리 파형(Waveform)을 그림(Spectrogram)으로 바꿔서 처리하므로 CV와 형제가 같습니다.
- 입력: 목소리 녹음 파일 (.wav)
- 출력: 텍스트(STT), 다른 목소리(Voice Conversion), 생성된 음악.
- 대표 모델: Whisper (OpenAI), WaveNet.
- 현업 활용: AI 콜센터, 회의록 자동 작성, AI 성우.
3. 추천 시스템 (Recommendation Systems)
"돈이 되는" 끝판왕 분야입니다. 넷플릭스, 유튜브, 쿠팡의 핵심 엔진입니다.
- 입력: 유저의 클릭 로그, 구매 이력, 시청 시간.
- 출력: 유저가 좋아할 만한 상품 리스트 (Ranking).
- 대표 모델: Wide & Deep, NCF (Neural Collaborative Filtering).
- 특징: 아주 희소한(Sparse) 데이터를 다룹니다. (상품은 1억 개인데 내가 산 건 10개뿐인 상황)
4. 강화학습 (Reinforcement Learning, RL)
데이터를 보고 배우는 게 아니라, **"행동(Action)"**을 해보고 점수(Reward)를 받으며 배웁니다. 알파고가 여기 속합니다.
- 입력: 현재 상태 (게임 화면, 로봇의 관절 각도).
- 출력: 최적의 행동 (오른쪽으로 이동, 관절 30도 꺾기).
- 대표 모델: DQN, PPO.
- 현업 활용: 로봇 제어, 물류 창고 최적화, 주식 트레이딩 봇, 게임 AI.
5. 그래프 뉴럴 네트워크 (GNN)
데이터가 표나 이미지가 아니라 **"관계(Network)"**로 연결된 경우입니다.
- 입력: SNS 친구 관계도, 분자 구조(원자 간 연결).
- 출력: 이 사람이 누구랑 친해질지 예측, 신약 개발(분자 속성 예측).
- 대표 모델: GCN (Graph Convolutional Network), GAT.
- 현업 활용: 페이스북/링크드인 친구 추천, 신약 발견, 구글지도의 도착 시간 예측.
[엔지니어링 관점의 팩트]
놀랍게도, 이 모든 분야의 train.py 학습 루프 5단계는 똑같습니다.
차이점은 딱 두 가지입니다.
- 데이터 로더 (__getitem__): 이미지를 읽느냐, 엑셀을 읽느냐, 소리 파일을 읽느냐의 차이.
- 모델 구조 (model.py):
- 이미지/소리 → CNN, ViT (공간/패턴 파악)
- 언어/시계열 → RNN, Transformer (순서/맥락 파악)
- 그래프 → GNN (연결 관계 파악)
[비유] AI는 '인간의 감각'과 같습니다.
- CV: 눈 (Vision)
- Audio: 귀 (Hearing)
- LLM: 입과 뇌 (Language & Logic)
- RL: 손과 발 (Action & Movement)
- RecSys: 취향 (Taste)
'AI 엔지니어준비' 카테고리의 다른 글
| 왜 cv2(OpenCV)를 썼는가? (PIL 대신) (0) | 2026.01.31 |
|---|---|
| dummy_data dummy_input 이란? (0) | 2026.01.31 |
| The Training Standard (0) | 2026.01.30 |
| 머리에 박아둬야 할 것과 검색해서 갖다 써도 되는 (0) | 2026.01.30 |
| ONNX(Open Neural Network Exchange)🌐 (0) | 2026.01.30 |