분류 모델(Regression Model) / 회귀 모델(Classification Model)
분류 모델과 회귀 모델은 각각 다른 유형의 문제를 해결하는 데 사용됩니다.
여기에 간단한 예시를 통해 설명하겠습니다.
1. 분류 모델 (Classification Model)
사용 예시
- 이메일 스팸 여부 분류
- 환자가 어떤 질병에 걸렸는지 판단 (예: 암 여부)
- 손글씨 숫자 인식 (0부터 9까지 숫자 분류)
설명
- 분류 모델은 입력 데이터를 여러 클래스 또는 범주 중 하나로 분류하는 데 사용됩니다.
- 출력은 이산적인 클래스 레이블이며, 주로 범주형 데이터를 다루는 데 적합합니다.
- 예측하려는 목표가 미리 정의된 클래스 또는 범주 중 하나에 속하는 경우에 사용됩니다.
대표 모델
- 로지스틱 회귀 (Logistic Regression)
이름에 '회귀'가 붙지만, 이진 분류 문제에 특히 유용하며, 간단하면서도 효과적인 모델 - 결정 트리 (Decision Trees)
해석이 쉽고 비선형 관계를 모델링하는 데 효과적 - 랜덤 포레스트 (Random Forest)
여러 결정 트리의 앙상블로 과적합을 줄이고 예측 성능을 향상 - 서포트 벡터 머신 (Support Vector Machines, SVM)
선형 및 비선형 문제에 적용할 수 있으며, 특히 데이터가 고차원이고 복잡한 경우에 유용 - K-최근접 이웃 (K-Nearest Neighbors, KNN)
이웃의 다수결로 예측을 수행하는 간단한 모델 - 그래디언트 부스팅 (Gradient Boosting)
여러 약한 학습기의 결합으로 강력한 예측 모델을 생성하며, XGBoost, LightGBM, CatBoost 등을 사용 - 신경망 (Neural Networks)
딥러닝의 발전으로 인해 복잡하고 대규모인 데이터셋에서 효과적인 성능을 발휘
2. 회귀 모델 (Regression Model)
사용 예시
- 주택 가격 예측
- 온도 예측
- 판매량 예측
설명
- 회귀 모델은 연속적인 값을 예측하는 데 사용됩니다.
- 출력은 연속적인 실수 값이며, 주로 수치형 데이터를 다루는 데 적합합니다.
- 예측하려는 목표가 연속적인 값인 경우에 사용됩니다.
대표 모델
- 선형 회귀 (Linear Regression)
가장 간단하면서도 효과적인 회귀 모델로, 선형 관계를 가정하고 데이터를 가장 잘 설명하는 직선을 찾습니다. - 릿지 회귀 (Ridge Regression)
L2 규제를 추가하여 다중공선성을 감소시키고 과적합을 방지하는 모델 - 라쏘 회귀 (Lasso Regression)
L1 규제를 적용하여 일부 특성의 가중치를 0으로 만들어 특성 선택의 효과를 가지는 모델 - 다항 회귀 (Polynomial Regression)
선형 회귀를 확장하여 다항식 함수를 사용하여 비선형 관계를 모델링하는 모델 - 서포트 벡터 머신 회귀 (Support Vector Machines, SVM Regression)
선형 및 비선형 회귀 문제에 적용 가능하며, 마진 최대화를 통해 회귀를 수행 - 랜덤 포레스트 회귀 (Random Forest Regression)
여러 결정 트리의 앙상블로 회귀 문제를 해결하는 모델로, 과적합을 줄이고 예측 성능을 향상 - 그래디언트 부스팅 회귀 (Gradient Boosting Regression)
여러 약한 학습기의 결합으로 강력한 예측 모델을 생성하며, XGBoost, LightGBM, CatBoost 등을 사용 - 신경망 회귀 (Neural Network Regression)
딥러닝의 일종으로, 다양한 특징과 복잡한 패턴을 학습할 수 있는 모델
본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.
'AI > Machine Learning' 카테고리의 다른 글
머신러닝의 정의 (2) | 2024.02.01 |
---|---|
Ensemble (앙상블) (0) | 2024.01.10 |
다중공선성 (VIF, 분산팽창계수) (0) | 2023.12.18 |
Metrics (모델의 성능 지표) (2) | 2023.11.19 |
라벨 인코딩, 원핫 인코딩 (0) | 2023.11.10 |