본문 바로가기
AI/Machine Learning

머신러닝의 정의

by Mesut Özil 2024. 2. 1.

머신러닝의 정의

머신러닝은 다양한 기준에 따라 분류될 수 있지만, 일반적으로 다음과 같이 크게 3가지분류됩니다.


1. 지도 학습 (Supervised Learning)

레이블이 지정된 훈련 데이터 사용하여 모델을 학습시키는 방법

입력 데이터와 해당하는 정답(레이블)을 모델에 제공하여 모델입력 출력 간 관계 학습

예를 들어, 이메일이 스팸인지 아닌지를 분류하거나 주택 가격을 예측하는 등의 작업에 적용

사용: 분류(classification)회귀(regression) 문제에 주로 사용

 

  • 선형 회귀 (Linear Regression): 연속적인 값 예측하는 데 사용되는 모델
  • 로지스틱 회귀 (Logistic Regression): 이진 분류를 수행하는 모델로, 확률 값을 예측
  • 결정 트리 (Decision Trees): 데이터를 기반으로 트리 구조를 만들어 분류 또는 회귀를 수행
  • k-최근접 이웃 (k-Nearest Neighbors, k-NN): 주변 이웃들 정보를 사용하여 분류 또는 회귀를 수행
  • 서포트 벡터 머신 (Support Vector Machines, SVM): 데이터를 분리하는 최적의 초평면을 찾아 분류하는 모델
  • 인공 신경망 (Artificial Neural Networks, ANN): 인간의 신경망 구조에서 영감을 받은 모델

 


2. 비지도 학습 (Unsupervised Learning)

레이블이 없는 데이터를 사용하여 모델을 학습시키는 방법

이러한 방법에서는 모델이 데이터의 숨겨진 구조나 패턴을 발견하도록 합니다.

즉, 입력 데이터만 사용하여 모델을 학습

예를 들어, 고객 세분화를 위한 군집화(cluster) 작업이나 데이터 시각화를 위한 차원 축소 작업에 적용

사용: 클러스터링, 차원 축소, 이상 탐지 등의 작업에 주로 사용

 

  • k-평균 클러스터링 (k-Means Clustering): 데이터를 여러 개의 클러스터그룹화하는 알고리즘
  • 주성분 분석 (Principal Component Analysis, PCA): 데이터의 차원을 축소하여 데이터의 주요 구조를 파악
  • 자기 조직화 지도 (Self-Organizing Maps, SOM): 고차원 데이터 → 저차원 그리드에 매핑하여 데이터 구조 시각화
  • 이상 탐지 (Anomaly Detection): 정상적인 패턴에서 벗어난 이상 값 탐지하는 방법

 


3. 강화 학습 (Reinforcement Learning)

에이전트가 환경과 상호 작용하며 특정 작업을 수행하고 그 결과에 따라 보상이나 처벌을 받는 방식으로 학습하는 방법

에이전트보상 최대화하기 위해 시행착오를 통해 학습

사용: 게임, 자율 주행 자동차, 주식 거래 등과 같이 시간적 순서가 있는 문제나 보상 최대화해야 하는 문제에 사용

 

  • Q-러닝 (Q-Learning): 상태-행동 쌍 가치를 학습하여 최적의 정책을 찾는 방법
  • 딥 Q-네트워크 (Deep Q-Networks, DQN): Q-러닝을 딥러닝과 결합하여 비선형 문제에 적용하는 방법
  • 정책 그래디언트 방법 (Policy Gradient Methods): 정책 직접 학습하여 보상을 최대화하는 방법
  • 심층 결정 방법 (Deep Deterministic Policy Gradient, DDPG): 연속적인 행동 공간에서 정책을 학습하는 방법

 

 

본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.

 

 

'AI > Machine Learning' 카테고리의 다른 글

분류 모델 / 회귀 모델  (0) 2024.01.17
Ensemble (앙상블)  (0) 2024.01.10
다중공선성 (VIF, 분산팽창계수)  (0) 2023.12.18
Metrics (모델의 성능 지표)  (2) 2023.11.19
라벨 인코딩, 원핫 인코딩  (0) 2023.11.10