본문 바로가기

데이콘14

딥러닝은 가챠중독이다 Computer Vision쪽 딥러닝 대회에 발을 들였습니다. 데이콘에서 제공한 baseline코드를 바탕으로 두고Kaggle 포럼, 챗지피티, 데이콘 등을 보며 최신기술을 파악하여 앞으로 사용할 템플릿을 조금씩 짜고 있습니다.Tabular data 머신러닝이랑 어느정도 비슷하지 않을까 하는 가벼운 마음에서 발을 들였는데완전히 다르더라구요.... 제가 느낀 큰 차이점은 다음과 같습니다: Tabular data 머신러닝 대회CV 딥러닝 대회데이터 전처리 방법이 다양한가?O△Feature Engineering을 하는가?OX모델 아키텍쳐가 다양한가?△O일반적인 수준의 EDA가 유용한가?OX순위에 영향을 미치는 것Feature Engineering, Tuning모델구조, Tuning 최신 머신러닝 대회들을 보.. 2025. 4. 14.
[ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - Feature Engineering 이제 거의 다 왔습니다!이번 포스트에서는 이전 글의 EDA를 바탕으로 진행한 최종 Feature Engineering 를 보여드리겠습니다. 이전 글: [ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - EDA본격적으로 데이터의 주요 Feature의 개요를 살피고,EDA를 수행해 feature engineering을 위한 insight를 얻어보겠습니다. 이번 대회는 feature가 상당히 많은 관계로 주요 feature와 그 engineering 방법만을 짚here-lives-mummy.tistory.com Overview본 대회는 일반적인 데이터분석 대회들과 달리train이 약 2,400건으로 데이터 크기가 매우 적습니다.따라서 feature engineering 시 public sc.. 2025. 4. 1.
[ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - EDA 본격적으로 데이터의 주요 Feature의 개요를 살피고,EDA를 수행해 feature engineering을 위한 insight를 얻어보겠습니다. 이번 대회는 feature가 상당히 많은 관계로 주요 feature와 그 engineering 방법만을 짚고 넘어갈게요.이전 글:  [ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - 소개자취방 찾을 때, 인터넷에서 괜찮은 매물만 추려다 가보면 허위매물인 경우가 많습니다.그럴 때마다 시간은 시간대로 쓰고, 기분만 잔뜩 상해버리곤 하죠. 이번 대회에는 이런 킹받는 부동산here-lives-mummy.tistory.com  주요 Feature주어진 train.csv, test.csv의 feature는 다음과 같습니다Feature namedtyp.. 2025. 3. 30.
[ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - 소개 자취방 찾을 때, 인터넷에서 괜찮은 매물만 추려다 가보면 허위매물인 경우가 많습니다.그럴 때마다 시간은 시간대로 쓰고, 기분만 잔뜩 상해버리곤 하죠. 이번 대회에는 이런 킹받는 부동산 허위매물을 걸러내는 모델을 만들어보겠습니다. 대회 소개데이콘 2025년 첫 대회입니다!2025년 1/6 ~ 2/28까지 총 두 달간 열렸는데요, 부동산 허위매물 분류 해커톤: 가짜를 색출하라! - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io 저는 이번 대회에서 최종 10등을 했습니다!이 대회는 부동산 매물의 다양한 정보를 기반으로 부동산의 허위매물 여부를 판단하는 이진 분류 문제입니다.  데이터 개요데이터 파일각각 간단히 설명하면1.train.csv : 모델을 학습시키.. 2025. 3. 29.
[ML 대회 해설] Kaggle: Regression with an Abalone Dataset Public 8등 풀이 - Feature Engineering & Model Tuning 이번 글에서는 EDA에서 얻었던 Insights를 토대로 최종 선택한 Feature Engineering과 모델 튜닝을 보여드리겠습니다. 이전 글: [ML 대회 해설] Regression with an Abalone Dataset Public 8등 풀이 - EDA지난 포스트에 이어, 이번 글에서는 데이터의 특성, feature의 개요를 EDA를 통해 살펴보겠습니다. 만약 아직 ML에 익숙하지 않은 분들이라면 Dacon 아파트 실거래가 예측 AI 경진대회부터 해보시는here-lives-mummy.tistory.com 개요이전 글에서 얻은 Insights는 아래와 같은데요, 이 중 제가 선택한 것만 굵은 글씨로 표시해보겠습니다:Insight 1. 상관계수가 높은 feature 중에서는 몇 개를 drop해야할.. 2025. 3. 29.
[ML 대회 해설] Kaggle: Regression with an Abalone Dataset Public 8등 풀이 - EDA 지난 포스트에 이어, 이번 글에서는 데이터의 특성, feature의 개요를 EDA를 통해 살펴보겠습니다.  지난 글:  [ML 대회 해설] Regression with an Abalone Dataset Public 8등 풀이 - 소개 (1)전복 좋아하시나요? 저는 별로 안 좋아하는데요,  시장 갈 때 마다 가격보고 기함하는 식재료 중 하나입니다.특히 큰 놈은 부르는게 값이더라구요. 한국에서는 전복의 크기를 표현할 때, kg에here-lives-mummy.tistory.com  Overview전복의 나이는 어떻게 알 수 있을까요?전복 패각의 나이테를 확인하면 됩니다. 전복은 나무처럼 해를 거듭할수록 패각에 나이테가 늘어납니다.때문에 속살을 긁어내 패각 안쪽 나이테를 세어보면 나이를 알 수 있지요. 하지만 .. 2025. 3. 12.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Feature Engineering (실패편) 이번 포스트에선 Feature Engineering (성공편)에서 다루지 않았던,실패한 Feature Engineering들과 실패한 이유에 대해 얘기해보겠습니다.  지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Model Tuning그간 따라오시느라 고생 많으셨습니다! 이제 거의 다 왔습니다.  지난 글에서는 EDA로 얻었던 insight를 기반으로 Feature Engineering을 진행했습니다.지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예here-lives-mummy.tistory.com 개요우리는 EDA 단계에서 얻은 다양한 insight를 기반으로 feature engineering을 수행했습니다.기존에 있던 feature에서 노이즈를.. 2025. 3. 10.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Model Tuning 그간 따라오시느라 고생 많으셨습니다! 이제 거의 다 왔습니다.  지난 글에서는 EDA로 얻었던 insight를 기반으로 Feature Engineering을 진행했습니다.지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Feature Engineering (성공편)지난 글에서는 EDA를 통해 각 데이터의 특성을 분석하여데이터 전처리 방법과 파생 Feature 아이디어를 얻어냈습니다. 지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDAhere-lives-mummy.tistory.com 이번 글에서는 완성한 모델에 최적화된 hyperparameter와 앙상블 방법을 찾는 Tuning 과정을 보여드리겠습니다. Hyperpa.. 2025. 3. 3.
[데이콘 대회후기] 부동산 허위매물 분류 해커톤 10등 달성 후기 2025년 첫 머신러닝 대회,'부동산 허위매물 분류 해커톤'에서 최종 10등을 차지했습니다!   그런데그런데 말입니다...이 코드, public score가 무려......... 95등이었습니다미친 Shake-up  하ㅏㅏㅏ이것이 바로 나의 도파민이 맛에 하는 데이터사이언스 하는 거거든요 107 submission이나 되고 왜 이 점수 밖에 못 냈냐! 라고 하시는 분들이 계실텐데요,사실 초반 50개의 submission에서 제가 멍청하게 Binary Classification으로 설정해야 하는 걸Regression으로 설정했기 때문입니다... 쉽게 말해서 Threshold 적용을 안 시켜 50 submission을 날렸습니다........ 어쩐지 점수 뒤1지게 안오르더라 각설하고 오늘은 이번 대회를 돌리.. 2025. 3. 1.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Feature Engineering (성공편) 지난 글에서는 EDA를 통해 각 데이터의 특성을 분석하여데이터 전처리 방법과 파생 Feature 아이디어를 얻어냈습니다. 지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDA (2): Object type Feature EDA이번 포스트에선 object type feature의 EDA를 수행해보겠습니다.  지난 글:  [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 3등 풀이 - EDA (1): Numeric Feature EDA오늘은 저번 포스트에서 뽑은 Numerhere-lives-mummy.tistory.com 이 글에서는 이를 바탕으로, 제가 제출한 최종 답안에서 Feature Engineering을 어떻게 하였는지를 설명하겠습니다.실.. 2025. 2. 25.