데이터를 크게 범주형(Categorical)과 수치형(Numerical)으로 나누고, 그 하위 항목까지 쉽게 설명 📊
1. 범주형 데이터 (Categorical Data)
범주형 데이터는 '분류' 또는 '그룹'으로 나눌 수 있는 데이터입니다. 이 데이터는 어떤 값 사이의 순서나 크기를 비교하는 것이 의미가 없습니다. 예를 들어, '색상'은 '빨강', '파랑', '노랑' 등으로 분류되지만, '빨강'이 '파랑'보다 크거나 작다고 말할 수는 없습니다.
하위 항목:
- 명목형(Nominal): 순서나 등급이 없는 범주형 데이터입니다. 단순히 이름을 붙여 분류만 가능합니다.
- 예시: 성별 (남, 여), 혈액형 (A, B, O, AB), 결혼 상태 (미혼, 기혼), 상품 종류 (전자기기, 의류, 식품)
- 순서형(Ordinal): 범주 간에 순서나 등급이 있는 데이터입니다. 하지만 그 순서 사이의 간격이 일정하지 않거나 의미가 없습니다.
- 예시: 학점 (A, B, C, F), 만족도 (매우 만족, 만족, 보통, 불만족), 옷 사이즈 (S, M, L, XL), 시험 등급 (1등급, 2등급, 3등급)
2. 수치형 데이터 (Numerical Data)
수치형 데이터는 숫자 형태로 표현되며, 양(quantity)이나 측정값(measurement)을 나타냅니다. 사칙연산이 가능하고, 값들 사이의 순서와 크기를 비교하는 것이 의미 있습니다.
하위 항목:
- 이산형(Discrete): 셀 수 있는, 정해진 값들로 이루어진 데이터입니다. 일반적으로 정수 형태를 띱니다.
- 예시: 가족 수 (1명, 2명, 3명), 상품 판매 개수 (10개, 20개), 주사위 눈금 (1, 2, 3, 4, 5, 6), 학생 수
- 연속형(Continuous): 무한한 값을 가질 수 있는 데이터입니다. 측정에 의해 얻어지며, 소수점 이하의 값도 가질 수 있습니다.
- 예시: 키 (175.5cm), 몸무게 (72.3kg), 온도 (25.7°C), 시간 (3.14159초)
'AI 엔지니어준비' 카테고리의 다른 글
| pandas describe()에 대해 (1) | 2025.08.14 |
|---|---|
| 컴퓨터 관점으로본 5,[5]의 백터 (4) | 2025.08.13 |
| IQR (Interquartile Range) 이란? (3) | 2025.08.13 |
| for _, row in tasks.iterrows(): 이구문에 대해서 (3) | 2025.08.11 |
| 파이썬 객체지향 알아야할 점 (3) | 2025.08.08 |