❓평온한 데이터에 이상치가 있을 때, 이를 제거하고 학습하는 것이 예측할 데이터에서 이상치는 못 맞추더라도 일반 데이터의 예측을 더 잘하게 되는지, 아니면 이상치도 포함해서 학습해야 이상치도 예측할 수 있는지 ?

장점: 이상치를 '노이즈'로 간주하고 제거하면, 모델은 나머지 일반 데이터의 핵심 패턴을 더 명확하게 학습 합니다. 따라서 대부분의 일반적인 데이터에 대한 예측 정확도가 매우 높아집니다. 💯
단점: 모델이 이상치를 아예 본 적이 없기 때문에, 예측할 데이터에 이상치가 나타나면 엉뚱하고 예측 불가능한 결과 를 내놓을 수 있습니다.

❓ 부스팅이란 어떤 앙상블 모델인지?, AdaBoost 이외의 부스팅 모델에는 무엇이 있는지? (1)	2025.08.28
❓ 결정 트리의 장점과 단점에 대해 (4)	2025.08.28
❓ 지니불순도(Gini Impurity) 수식을 이해하기 (2)	2025.08.27
독립변수 (X) 와 종속변수(y) 를 나누는 이유? (1)	2025.08.26
왜 train 데이터만 수정하지 않고 test 데이터도 수정할까? (0)	2025.08.26

티스토리툴바