본문 바로가기

Machine Learning8

[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Feature Engineering (실패편) 이번 포스트에선 Feature Engineering (성공편)에서 다루지 않았던,실패한 Feature Engineering들과 실패한 이유에 대해 얘기해보겠습니다. 지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Model Tuning그간 따라오시느라 고생 많으셨습니다! 이제 거의 다 왔습니다.  지난 글에서는 EDA로 얻었던 insight를 기반으로 Feature Engineering을 진행했습니다.지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예here-lives-mummy.tistory.com 개요우리는 EDA 단계에서 얻은 다양한 insight를 기반으로 feature engineering을 수행했습니다.기존에 있던 feature에서 노이즈를 .. 2025. 3. 10.
[Dacon 대회후기] 부동산 허위매물 분류 해커톤 10등 달성 후기 2025년 첫 머신러닝 대회,'부동산 허위매물 분류 해커톤'에서 최종 10등을 차지했습니다!   그런데그런데 말입니다...이 코드, public score가 무려......... 95등이었습니다미친 Shake-up  하ㅏㅏㅏ이것이 바로 나의 도파민이 맛에 하는 데이터사이언스 하는 거거든요 107 submission이나 되고 왜 이 점수 밖에 못 냈냐! 라고 하시는 분들이 계실텐데요,사실 초반 50개의 submission에서 제가 멍청하게 Binary Classification으로 설정해야 하는 걸Regression으로 설정했기 때문입니다... 쉽게 말해서 Threshold 적용을 안 시켜 50 submission을 날렸습니다........ 어쩐지 점수 뒤1지게 안오르더라 각설하고 오늘은 이번 대회를 돌리.. 2025. 3. 1.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDA (3): Object type Feature EDA 이번 포스트에선 object type feature의 EDA를 수행해보겠습니다.  지난 글:  [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 3등 풀이 - EDA (1): Numeric Feature EDA오늘은 저번 포스트에서 뽑은 Numeric feature 들의 feature 중요도를 기반으로 본격적인 EDA에 들어가겠습니다. 지난 글 https://here-lives-mummy.tistory.com/15 [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경here-lives-mummy.tistory.com  데이터에서 주어진 Object Type Feature는 다음과 같습니다:city : 도시 이름dong: 행정동 이름jibun: 지번apt: 아파트 이름addr_kr:.. 2025. 1. 28.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDA (1): Numeric Feature EDA 오늘은 저번 포스트에서 뽑은 Numeric feature 들의 feature 중요도를 기반으로 본격적인 EDA에 들어가겠습니다. 지난 글 https://here-lives-mummy.tistory.com/15 [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 7등 풀이 - 소개 (2): Numeric Feature 톺아보기저번 포스트에 이어, 이번 포스트에선 주요 Feature와 Numeric feature의 개요를 간단히 살펴보겠습니다. 지난 글https://here-lives-mummy.tistory.com/10 [ML 대회 튜토리얼] Dacon 아파트 실거래가 예측 AI 경진대here-lives-mummy.tistory.comFeature 중요도 분석XGBoost, CatBoost의.. 2025. 1. 11.
[ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - 소개 (2): Numeric Feature 톺아보기 저번 포스트에 이어, 이번 포스트에선 주요 Feature와 Numeric feature의 개요를 간단히 살펴보겠습니다. 지난 글https://here-lives-mummy.tistory.com/10 [ML 대회 튜토리얼] Dacon 아파트 실거래가 예측 AI 경진대회 - 소개 (1)캐글은 영어로 되어있어 어렵고, 타이타닉 프로젝트는 식상한 ML 입문자분들께 추천하는 대회입니다.기본 ML 지식과 함께 시계열데이터 예측 입문까지 해볼 수 있었습니다!한국 데이터라 익숙하here-lives-mummy.tistory.com 주요 Feature주어진 train.csv, test.csv의 feature는 다음과 같습니다:feature namedtype결측치 (train)결측치 (test)설명transaction_id.. 2025. 1. 8.
[머신러닝 대회 입문] 머신러닝 Workflow: 머신러닝이란? 머신러닝 과정, 데이터 분석하기 (1) 머신러닝을 입문할 때 가장 어려움을 겪는 부분은 어떻게 모델을 학습시키는지, 그 방법을 정립하는 단계입니다. 최근 머신러닝에 대한 관심이 집중되며 다양한 머신러닝 관련 아티클이나 서적을 다수 찾아볼 수 있습니다만, 정작 좋은 모델을 만들기 위한 일관된 Workflow에 대한 정보는 찾기 어렵습니다.저 역시 이 과정을 이해하고, 저만의 방법을 정립해 체화하는데에 오랜 시간이 걸렸는데요, 오늘은 머신러닝, 특히 머신러닝 대회에 입문하는 초보를 위한 ML Workflow를 설명하겠습니다. 이 내용은 일반 머신러닝 뿐 아니라 딥러닝에도 적용됩니다! 큰 도움이 되길 바래요 ;) * 주의: 이 글은 입문자를 위해 머신러닝의 개념을 알기쉽게 의역한 부분이 다소 존재합니다.머신러닝이란?머신러닝이란, 데이터로부터 패턴을.. 2025. 1. 4.
[Kaggle 대회후기] Exploring Mental Health Data 상위 8% 달성 2024년 Kaggle Playground Series, 시즌 4 Episode 11 대회인 "Exploring Mental Health Data"의 상위 8% 에 석권했습니다! 학기 중인데다 졸업연구까지 겹치는 바람에 후반갈수록 즐겜모드 되어서 하이퍼파라미터 튜닝도 못 하고 제출했는데 오랜만에 상위권에 랭킹해서 매우행복합니다 흫흐흐흐흫 사실 이전에 각잡고 참여했던 두 Playground 대회에서 Shake-up으로 점수가 떡락하는 쓰라림을 맛보며 조금씩 슬럼프가 왔던 것 같아요. 그랬는데 이렇게 좋은 점수가 나와줘서 넘나 행복합니다... ♥ ♥ 풀이과정은 방학 즈음에 가져오겠습니다! 2024. 12. 2.
[Kaggle 대회] Ariel Data Challenge 2024 - Kaggle Notebook Submission 도전기 어떠한 선택.을 했습니다. 기계학습 과제인 자유주제 프로젝트로 NeurlPS 개최 Ariel Data Challenge 2024에 도전해보았습니다.https://www.kaggle.com/competitions/ariel-data-challenge-2024/overview NeurIPS - Ariel Data Challenge 2024Derive exoplanet signals from Ariel's optical instrumentswww.kaggle.com  Testset 파일 제출하는 대회나 ChatGPT 프롬프트 작성하는 대회는 질리도록 참여해봤기에 새로운 걸 해보고 싶었습니다무엇보다 학교잖아요? 학교아니면 어디서 도전이라는걸 해보겠습니까... 그렇게 참가한 대회...  처음부터 엄청난 포스를 풍.. 2024. 11. 30.