1. 이미지 분류 (Image Classification)
가장 기초적인 단계입니다. 사진 한 장을 보고 "이것이 무엇이다"라고 **하나의 정답(라벨)**을 맞추는 것입니다.
- 기능: 이미지 전체를 보고 가장 확률이 높은 클래스(이름) 하나를 출력합니다.
- 요리사 비유: 요리사가 완성된 접시를 딱 보고 "음, 이건 파스타군!" 하고 메뉴 이름을 맞추는 것입니다. 접시 위에 포크가 있든 소스가 묻었든 상관없이, 전체적인 요리의 정체성만 판단합니다.
2. 객체 인식 (Object Detection)
분류보다 한 단계 더 나아갑니다. 이미지 안에 무엇이(What) 있고, 어디에(Where) 있는지를 네모난 박스(Bounding Box)로 찾아냅니다.
- 기능: 이미지 내의 여러 물체를 찾아서 각각 네모 박스를 치고, 그 박스가 무엇인지 맞춥니다. (예: 사람, 차, 신호등)
- 요리사 비유: 요리사가 접시를 보면서 **"여기 네모난 구역엔 미트볼이 있고, 저쪽 네모난 구역엔 바질 잎이 있네"**라며 재료의 위치를 네모나게 표시하는 것입니다.
3. 이미지 세그멘테이션 (Image Segmentation)
객체 인식보다 훨씬 정교합니다. 네모 박스가 아니라, 픽셀 단위로 물체의 경계선을 정확하게 따내는 기술입니다. 흔히 '누끼 딴다'고 표현하는 작업과 비슷합니다.
- 기능: 이미지의 모든 픽셀마다 "너는 배경이야", "너는 고양이야"라고 색칠하듯 분류합니다. 물체의 정확한 모양과 윤곽선을 알 수 있습니다.
- 요리사 비유: 요리사가 칼을 들고 접시 위에서 미트볼 모양 그대로, 바질 잎 모양 그대로 정교하게 잘라내어 분리하는 것입니다. 소스가 묻은 부분까지 정확하게 구별해냅니다.
4. 이미지 생성 (Image Generation)
앞의 3가지는 있는 이미지를 '분석'하는 것이었다면, 이것은 없는 이미지를 '만들어내는' 것입니다. (최근의 Stable Diffusion, Midjourney 등이 여기에 해당합니다.)
- 기능: 노이즈(무작위 점)나 텍스트 설명을 입력받아, 세상에 없던 새로운 이미지를 그려냅니다.
- 요리사 비유: 손님이 "딸기 맛이 나는 매운 피자를 만들어줘"라고 주문하면, 요리사가 기존 레시피 없이 상상력을 발휘해 새로운 요리를 탄생시키는 것입니다.
'AI 엔지니어준비' 카테고리의 다른 글
| weight 단어에 대한 해석 (0) | 2026.01.15 |
|---|---|
| 이미지 분석 코드 파악해보기 (1) | 2026.01.15 |
| 🏛️ [실전 아키텍처] Next.js와 FastAPI로 구축하는 AI 패션 코디 서비스 "FitCheck" 설계도 🎨👗 (1) | 2026.01.05 |
| ⚡️ FastAPI로 만드는 AI API: 전문가처럼 구조 잡기! 🏗️🚀 (0) | 2026.01.05 |
| 🚀 Streamlit으로 AI 모델 웹 앱 만들기: 3단계 완전 정복! 🛠️ (0) | 2026.01.05 |