본문 바로가기
AI/Machine Learning

분류 모델 / 회귀 모델

by Mesut Özil 2024. 1. 17.

분류 모델(Regression Model) / 회귀 모델(Classification Model)

분류 모델회귀 모델은 각각 다른 유형의 문제를 해결하는 데 사용됩니다.

여기에 간단한 예시를 통해 설명하겠습니다.

 

1. 분류 모델 (Classification Model)

사용 예시
  • 이메일 스팸 여부 분류
  • 환자가 어떤 질병에 걸렸는지 판단 (예: 암 여부)
  • 손글씨 숫자 인식 (0부터 9까지 숫자 분류)
설명
  • 분류 모델은 입력 데이터를 여러 클래스 또는 범주 중 하나 분류하는 데 사용됩니다.
  • 출력은 이산적인 클래스 레이블이며, 주로 범주형 데이터를 다루는 데 적합합니다.
  • 예측하려는 목표가 미리 정의된 클래스 또는 범주 중 하나에 속하는 경우에 사용됩니다.
대표 모델
  • 로지스틱 회귀 (Logistic Regression)
    이름에 '회귀'가 붙지만, 이진 분류 문제에 특히 유용하며, 간단하면서도 효과적인 모델
  • 결정 트리 (Decision Trees)
    해석이 쉽고 비선형 관계 모델링하는 데 효과적
  • 랜덤 포레스트 (Random Forest)
    여러 결정 트리 앙상블로 과적합을 줄이고 예측 성능을 향상
  • 서포트 벡터 머신 (Support Vector Machines, SVM)
    선형 비선형 문제에 적용할 수 있으며, 특히 데이터가 고차원이고 복잡한 경우에 유용
  • K-최근접 이웃 (K-Nearest Neighbors, KNN)
    이웃의 다수결로 예측을 수행하는 간단한 모델
  • 그래디언트 부스팅 (Gradient Boosting)
    여러 약한 학습기 결합으로 강력한 예측 모델을 생성하며, XGBoost, LightGBM, CatBoost 등을 사용
  • 신경망 (Neural Networks)
    딥러닝의 발전으로 인해 복잡하고 대규모인 데이터셋에서 효과적인 성능을 발휘

 

2. 회귀 모델 (Regression Model)

사용 예시
  • 주택 가격 예측
  • 온도 예측
  • 판매량 예측
설명
  • 회귀 모델은 연속적인 값 예측하는 데 사용됩니다.
  • 출력은 연속적인 실수 값이며, 주로 수치형 데이터를 다루는 데 적합합니다.
  • 예측하려는 목표가 연속적인 값인 경우에 사용됩니다.
대표 모델
  • 선형 회귀 (Linear Regression)
    가장 간단하면서도 효과적인 회귀 모델로, 선형 관계 가정하고 데이터를 가장 잘 설명하는 직선을 찾습니다.
  • 릿지 회귀 (Ridge Regression)
    L2 규제를 추가하여 다중공선성 감소시키고 과적합 방지하는 모델
  • 라쏘 회귀 (Lasso Regression)
    L1 규제를 적용하여 일부 특성의 가중치 0으로 만들어 특성 선택의 효과를 가지는 모델
  • 다항 회귀 (Polynomial Regression)
    선형 회귀를 확장하여 다항식 함수를 사용하여 비선형 관계 모델링하는 모델
  • 서포트 벡터 머신 회귀 (Support Vector Machines, SVM Regression)
    선형 비선형 회귀 문제에 적용 가능하며, 마진 최대화를 통해 회귀를 수행
  • 랜덤 포레스트 회귀 (Random Forest Regression)
    여러 결정 트리 앙상블로 회귀 문제를 해결하는 모델로, 과적합을 줄이고 예측 성능을 향상
  • 그래디언트 부스팅 회귀 (Gradient Boosting Regression)
    여러 약한 학습기 결합으로 강력한 예측 모델을 생성하며, XGBoost, LightGBM, CatBoost 등을 사용
  • 신경망 회귀 (Neural Network Regression)
    딥러닝의 일종으로, 다양한 특징과 복잡한 패턴을 학습할 수 있는 모델

 

 

본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.

'AI > Machine Learning' 카테고리의 다른 글

머신러닝의 정의  (2) 2024.02.01
Ensemble (앙상블)  (0) 2024.01.10
다중공선성 (VIF, 분산팽창계수)  (0) 2023.12.18
Metrics (모델의 성능 지표)  (2) 2023.11.19
라벨 인코딩, 원핫 인코딩  (0) 2023.11.10