반응형

캐글 5

[Kaggle Extra Study] 1. 지도 학습 vs. 비지도 학습

해당 포스트는 auto encoder를 학습하던 중 지도 학습과 비지도 학습에 대한 개념을 학습하기 위해 작성되었습니다. 지도 학습(Supervised Learning)지도 학습이란 머신러닝 모델이 데이터를 학습할 때, 학습하는 데이터가 레이블(label)되어 있는 경우를 말합니다.  지도 학습의 종류에는 크게 회귀(Regression)와 분류(classification)이 있습니다. 회귀는 훈련 데이터와 이에 매칭되는 타겟 변수의 값들(레이블)을 학습하여, 새로운 입력 데이터에 대한 출력 값을 예측하는 기법입니다.분류는 말그대로 훈련 데이터와 이에 매칭되는 레이블을 학습하여, 새로운 입력 데이터의 범주형(categorical) 클래스를 예측하는 기법입니다.비지도 학습(Unsupervised Learni..

캐글 보충 2024.10.22

근황 - 2024.10.21

그동안 블로그 작성은 잘 못했지만 병특 근무를 위한 개인 공부는 어느 때보다 열심히 했었다. 운영하던 학교 수강평 웹 서비스를 크로스 플랫폼 모바일 앱 서비스로 개편하여 출시하였고, 크롤링을 공부하여 해외 구매 대행 사업자들이 무료로 쓸 수 있는 서비스를 개발해보기도 했다. 그렇게 개인공부를 하며 대학교는 졸업했고 한국에 돌아왔지만, 병특 채용을 약속했던 스타트업은 인수합병을 당해버려서 무산되어버렸다.  ‎쑤강평‎학교 수업들에 대한 수강평, 게시판 기능, 투두 기능 등을 포함한 학생들의 학업을 돕는 앱입니다.apps.apple.com 원래 병특 채용을 약속했던 기업은 구현 실력이 이론 혹은 cs 전반에 대한 배경 지식보다 중요한 시리즈 a 정도의 스타트업이었고, 채용을 약속받은 상태였기 때문에 이론적인 ..

공부법 2024.10.21

캐글 도전기 (2) - 7/5 ~ 7/14

캐글에 대해 알게된 점: 1.0은 불가능하다 일단 캐글에 대해 새롭게 알게 된 점 한 가지가 있는데 캐글 뉴비들에게는 나름 헷갈릴 수 있을 것 같아서 짚고 넘어가려 한다. 캐글을 시작하면 타이타닉이나 주택가격예측 대회를 자연스럽게 거쳐가게 된다. 각 대회에 리더보드를 확인해보면 1.0의 정확도를 받은 사람들이 굉장히 많다는 것을 확인 할 수 있다. 이를 보고 글쓴이는 1.0의 정확도를 받는 것이 이 대회를 완벽하게 이해하고 더 정교한 데이터 전처리와 모델링을 통해서 나오는 이상적인 결과라고 생각했고 이를 위해 한참을 다른 사람들의 코드를 보며 연구했다. 그러던 중 놀라운 결과를 알게 되었는데 1.0의 정확도가 나오는 것은 불가능할 뿐만 아니라 이 대회의 목적이 아니라는 것이었다. 정확도라고 함은 학습 데..

카테고리 없음 2023.07.18

캐글 도전기 (1) - 6/23 ~ 7/1

캐글에 도전하겠다고 마음을 먹었지만 공부를 어디서부터 얼마나 해야 될지 굉장히 막막했다. 그동안 다른 개발공부를 해오며 터득한 해결 방법은 무작정 비싸고 양이 많은 책이나 강의를 결제하기 보다는 쉬운 책 하나를 일단 정독하는 것이 방향성을 잡는데에 큰 도움을 준다는 것이었다. 캐글에 입문하며 본 첫 책은 '쉽게 시작하는 캐글 데이터 분석' 이었고 캐글 대회의 흐름을 맛본다는 소기의 목적은 달성한 것 같다. 책을 읽으며 간단한 데이터 분석에 대한 설명과 함께 캐글 대회의 공식 튜토리얼 대회인 타이타닉 대회와 주택 가격 예측 대회를 직접 해보며 데이터 분석의 흐름을 느낄 수 있었다. 이에 대한 내용을 공유하고자 한다 1) 데이터 분석 데이터 분석은 데이터 혹은 해당 일의 범위에 따라 그 목적도 다양함 - 예..

카테고리 없음 2023.07.04
반응형