본문 바로가기

캐글11

딥러닝은 가챠중독이다 Computer Vision쪽 딥러닝 대회에 발을 들였습니다. 데이콘에서 제공한 baseline코드를 바탕으로 두고Kaggle 포럼, 챗지피티, 데이콘 등을 보며 최신기술을 파악하여 앞으로 사용할 템플릿을 조금씩 짜고 있습니다.Tabular data 머신러닝이랑 어느정도 비슷하지 않을까 하는 가벼운 마음에서 발을 들였는데완전히 다르더라구요.... 제가 느낀 큰 차이점은 다음과 같습니다: Tabular data 머신러닝 대회CV 딥러닝 대회데이터 전처리 방법이 다양한가?O△Feature Engineering을 하는가?OX모델 아키텍쳐가 다양한가?△O일반적인 수준의 EDA가 유용한가?OX순위에 영향을 미치는 것Feature Engineering, Tuning모델구조, Tuning 최신 머신러닝 대회들을 보.. 2025. 4. 14.
[ML 대회 해설] Kaggle: Regression with an Abalone Dataset Public 8등 풀이 - Feature Engineering & Model Tuning 이번 글에서는 EDA에서 얻었던 Insights를 토대로 최종 선택한 Feature Engineering과 모델 튜닝을 보여드리겠습니다. 이전 글: [ML 대회 해설] Regression with an Abalone Dataset Public 8등 풀이 - EDA지난 포스트에 이어, 이번 글에서는 데이터의 특성, feature의 개요를 EDA를 통해 살펴보겠습니다. 만약 아직 ML에 익숙하지 않은 분들이라면 Dacon 아파트 실거래가 예측 AI 경진대회부터 해보시는here-lives-mummy.tistory.com 개요이전 글에서 얻은 Insights는 아래와 같은데요, 이 중 제가 선택한 것만 굵은 글씨로 표시해보겠습니다:Insight 1. 상관계수가 높은 feature 중에서는 몇 개를 drop해야할.. 2025. 3. 29.
[ML 대회 해설] Kaggle: Regression with an Abalone Dataset Public 8등 풀이 - EDA 지난 포스트에 이어, 이번 글에서는 데이터의 특성, feature의 개요를 EDA를 통해 살펴보겠습니다.  지난 글:  [ML 대회 해설] Regression with an Abalone Dataset Public 8등 풀이 - 소개 (1)전복 좋아하시나요? 저는 별로 안 좋아하는데요,  시장 갈 때 마다 가격보고 기함하는 식재료 중 하나입니다.특히 큰 놈은 부르는게 값이더라구요. 한국에서는 전복의 크기를 표현할 때, kg에here-lives-mummy.tistory.com  Overview전복의 나이는 어떻게 알 수 있을까요?전복 패각의 나이테를 확인하면 됩니다. 전복은 나무처럼 해를 거듭할수록 패각에 나이테가 늘어납니다.때문에 속살을 긁어내 패각 안쪽 나이테를 세어보면 나이를 알 수 있지요. 하지만 .. 2025. 3. 12.
[ML 대회 해설] Kaggle: Regression with an Abalone Dataset Public 8등 풀이 - 소개 (1) 전복 좋아하시나요? 저는 별로 안 좋아하는데요,  시장 갈 때 마다 가격보고 기함하는 식재료 중 하나입니다.특히 큰 놈은 부르는게 값이더라구요. 한국에서는 전복의 크기를 표현할 때, kg에 몇 마리가 되는지를 뜻하는 단위 '미' 를 사용합니다. 그리고 이 크기는 전복의 나이와 밀접한 연관성이 있다고 알려져 있습니다. 하지만 전복에게 나이를 물어본다고 답할리는 없겠죠.따라서 이 대회에서 우리는 전복의 여러가지 내, 외적 요인을 종합해 전복의 나이를 예측하는 모델을 만들어볼 것입니다. 저는 이번 시즌에서 Public 8등, Private 전세계 상위 5%를 차지했답니다! 대회 소개Kaggle season 4, episode 4 (2024년 4월 ~ 5월) 대회로, 상당히 최근에 개최했습니다. Regressi.. 2025. 3. 11.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Feature Engineering (실패편) 이번 포스트에선 Feature Engineering (성공편)에서 다루지 않았던,실패한 Feature Engineering들과 실패한 이유에 대해 얘기해보겠습니다.  지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Model Tuning그간 따라오시느라 고생 많으셨습니다! 이제 거의 다 왔습니다.  지난 글에서는 EDA로 얻었던 insight를 기반으로 Feature Engineering을 진행했습니다.지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예here-lives-mummy.tistory.com 개요우리는 EDA 단계에서 얻은 다양한 insight를 기반으로 feature engineering을 수행했습니다.기존에 있던 feature에서 노이즈를.. 2025. 3. 10.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDA (3): Object type Feature EDA 이번 포스트에선 object type feature의 EDA를 수행해보겠습니다.  지난 글:  [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 3등 풀이 - EDA (1): Numeric Feature EDA오늘은 저번 포스트에서 뽑은 Numeric feature 들의 feature 중요도를 기반으로 본격적인 EDA에 들어가겠습니다. 지난 글 https://here-lives-mummy.tistory.com/15 [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경here-lives-mummy.tistory.com  데이터에서 주어진 Object Type Feature는 다음과 같습니다:city : 도시 이름dong: 행정동 이름jibun: 지번apt: 아파트 이름addr_kr:.. 2025. 1. 28.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDA (1): Numeric Feature EDA 오늘은 저번 포스트에서 뽑은 Numeric feature 들의 feature 중요도를 기반으로 본격적인 EDA에 들어가겠습니다. 지난 글 https://here-lives-mummy.tistory.com/15 [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 7등 풀이 - 소개 (2): Numeric Feature 톺아보기저번 포스트에 이어, 이번 포스트에선 주요 Feature와 Numeric feature의 개요를 간단히 살펴보겠습니다. 지난 글https://here-lives-mummy.tistory.com/10 [ML 대회 튜토리얼] Dacon 아파트 실거래가 예측 AI 경진대here-lives-mummy.tistory.comFeature 중요도 분석XGBoost, CatBoost의.. 2025. 1. 11.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - 소개 (2): Numeric Feature 톺아보기 저번 포스트에 이어, 이번 포스트에선 주요 Feature와 Numeric feature의 개요를 간단히 살펴보겠습니다. 지난 글https://here-lives-mummy.tistory.com/10 [ML 대회 튜토리얼] Dacon 아파트 실거래가 예측 AI 경진대회 - 소개 (1)캐글은 영어로 되어있어 어렵고, 타이타닉 프로젝트는 식상한 ML 입문자분들께 추천하는 대회입니다.기본 ML 지식과 함께 시계열데이터 예측 입문까지 해볼 수 있었습니다!한국 데이터라 익숙하here-lives-mummy.tistory.com 주요 Feature주어진 train.csv, test.csv의 feature는 다음과 같습니다:feature namedtype결측치 (train)결측치 (test)설명transaction_id.. 2025. 1. 8.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - 소개 (1) 캐글은 영어로 되어있어 어렵고, 타이타닉 프로젝트는 식상한 ML 입문자분들께 추천하는 대회입니다.기본 ML 지식과 함께 시계열데이터 예측 입문까지 해볼 수 있었습니다!한국 데이터라 익숙하기도 하구요 ㅎㅎ운 좋게도 현재 Public 2등에 석권했습니다 ㅎㅎ이 포스트에서는 간단히 대회 개요를 소개하고, 제 개인적인 풀이는 보기좋게 여러 포스트로 나눠 올려볼게요 ;) 머신러닝 입문자이거나, 머신러닝기본 워크플로가 궁금하신 분은 이 글을 참고해주세요 대회 소개https://dacon.io/competitions/official/21265/ 아파트 실거래가 예측 AI 경진대회 - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io이 대회는 직방에서 제공한 2008-.. 2025. 1. 3.
[2주차] Binary classification: 2nd level. Porto Seguro's Safe Driver Prediction 본 글은 이유한님의 Kaggle-KR 강의를 학습하여 작성하였습니다. 이유현님의 강의 링크 https://kaggle-kr.tistory.com/38 Porto Seguro’s Safe Driver Prediction[1] @홍정호, KQNG --- competition: Porto Seguro’s Safe Driver Prediction original kernel: https://www.kaggle.com/bertcarremans/data-preparation-exploration share: @h0609zxc, 홍정호, KQNG date: 2019.07.12 --- 유한님이 만든 커리큘럼에 있는 커널 중 하나 kaggle-kr.tistory.com Porto Seguro's Safe Driver P.. 2023. 3. 25.