캐글

[캐글 보충] 1. 지도 학습 vs. 비지도 학습

dongsunseng 2024. 10. 22. 02:07

해당 포스트는 auto encoder를 학습하던 중 지도 학습과 비지도 학습에 대한 개념을 학습하기 위해 작성되었습니다.

 

지도 학습(Supervised Learning)

지도 학습이란 머신러닝 모델이 데이터를 학습할 때, 학습하는 데이터가 레이블(label)되어 있는 경우를 말합니다. 

 

지도 학습의 종류에는 크게 회귀(Regression)와 분류(classification)이 있습니다. 

  • 회귀는 훈련 데이터와 이에 매칭되는 타겟 변수의 값들(레이블)을 학습하여, 새로운 입력 데이터에 대한 출력 값을 예측하는 기법입니다.
  • 분류는 말그대로 훈련 데이터와 이에 매칭되는 레이블을 학습하여, 새로운 입력 데이터의 범주형(categorical) 클래스를 예측하는 기법입니다.

비지도 학습(Unsupervised Learning)

느낌이 오셨겠지만 비지도 학습은 레이블이 없는 상태에서 머신러닝 모델을 학습시키는 경우이고, 데이터의 특성을 파악하여 새로운 규칙성을 알아내야 할 때 사용합니다. 

 

비지도 학습에는 크게 군집(Clustering)과 차원 축소(Dimensionality Reduction)이 있습니다.

  • 군집은 데이터를 의미가 있는 부분 집합(Cluster)로 나누는 기법입니다. 
  • 차원 축소는 다루기 힘든 고차원의 데이터의 차원을 축소시켜서 다루기 쉽게 만드는 기법입니다.
    • 모델의 성능을 향상시키고, 처리 속도를 개선하거나 저장 공간을 절약하기 위해 사용하는 기법입니다.

오토 인코더(Auto Encoder)

오토 인코더는 비지도 학습 중 차원 축소 기법에 해당하는 기술로, 입력 데이터를 압축(인코딩)하고 다시 복원(디코딩)하는 과정을 통해 데이터의 중요한 특성을 자동으로 학습하고 압축된 표현을 생성합니다. 

 

시계열 데이터와 같은 복잡한 데이터에 사용하면 이점이 있습니다. 

 

오토 인코더에 대한 자세한 내용은 다음 포스트에서 다루겠습니다:

 

 

The way to get started is to quit talking and begin doing
- Walt Disney -

 

'캐글' 카테고리의 다른 글

근황 - 2024.10.21  (1) 2024.10.21