deep learning11 딥러닝은 가챠중독이다 Computer Vision쪽 딥러닝 대회에 발을 들였습니다. 데이콘에서 제공한 baseline코드를 바탕으로 두고Kaggle 포럼, 챗지피티, 데이콘 등을 보며 최신기술을 파악하여 앞으로 사용할 템플릿을 조금씩 짜고 있습니다.Tabular data 머신러닝이랑 어느정도 비슷하지 않을까 하는 가벼운 마음에서 발을 들였는데완전히 다르더라구요.... 제가 느낀 큰 차이점은 다음과 같습니다: Tabular data 머신러닝 대회CV 딥러닝 대회데이터 전처리 방법이 다양한가?O△Feature Engineering을 하는가?OX모델 아키텍쳐가 다양한가?△O일반적인 수준의 EDA가 유용한가?OX순위에 영향을 미치는 것Feature Engineering, Tuning모델구조, Tuning 최신 머신러닝 대회들을 보.. 2025. 4. 14. [ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - EDA 본격적으로 데이터의 주요 Feature의 개요를 살피고,EDA를 수행해 feature engineering을 위한 insight를 얻어보겠습니다. 이번 대회는 feature가 상당히 많은 관계로 주요 feature와 그 engineering 방법만을 짚고 넘어갈게요.이전 글: [ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - 소개자취방 찾을 때, 인터넷에서 괜찮은 매물만 추려다 가보면 허위매물인 경우가 많습니다.그럴 때마다 시간은 시간대로 쓰고, 기분만 잔뜩 상해버리곤 하죠. 이번 대회에는 이런 킹받는 부동산here-lives-mummy.tistory.com 주요 Feature주어진 train.csv, test.csv의 feature는 다음과 같습니다Feature namedtyp.. 2025. 3. 30. [ML 대회 해설] 데이콘 부동산 허위매물 분류 해커톤 10등 풀이 - 소개 자취방 찾을 때, 인터넷에서 괜찮은 매물만 추려다 가보면 허위매물인 경우가 많습니다.그럴 때마다 시간은 시간대로 쓰고, 기분만 잔뜩 상해버리곤 하죠. 이번 대회에는 이런 킹받는 부동산 허위매물을 걸러내는 모델을 만들어보겠습니다. 대회 소개데이콘 2025년 첫 대회입니다!2025년 1/6 ~ 2/28까지 총 두 달간 열렸는데요, 부동산 허위매물 분류 해커톤: 가짜를 색출하라! - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io 저는 이번 대회에서 최종 10등을 했습니다!이 대회는 부동산 매물의 다양한 정보를 기반으로 부동산의 허위매물 여부를 판단하는 이진 분류 문제입니다. 데이터 개요데이터 파일각각 간단히 설명하면1.train.csv : 모델을 학습시키.. 2025. 3. 29. [ML 대회 해설] Kaggle: Regression with an Abalone Dataset Public 8등 풀이 - 소개 (1) 전복 좋아하시나요? 저는 별로 안 좋아하는데요, 시장 갈 때 마다 가격보고 기함하는 식재료 중 하나입니다.특히 큰 놈은 부르는게 값이더라구요. 한국에서는 전복의 크기를 표현할 때, kg에 몇 마리가 되는지를 뜻하는 단위 '미' 를 사용합니다. 그리고 이 크기는 전복의 나이와 밀접한 연관성이 있다고 알려져 있습니다. 하지만 전복에게 나이를 물어본다고 답할리는 없겠죠.따라서 이 대회에서 우리는 전복의 여러가지 내, 외적 요인을 종합해 전복의 나이를 예측하는 모델을 만들어볼 것입니다. 저는 이번 시즌에서 Public 8등, Private 전세계 상위 5%를 차지했답니다! 대회 소개Kaggle season 4, episode 4 (2024년 4월 ~ 5월) 대회로, 상당히 최근에 개최했습니다. Regressi.. 2025. 3. 11. [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Model Tuning 그간 따라오시느라 고생 많으셨습니다! 이제 거의 다 왔습니다. 지난 글에서는 EDA로 얻었던 insight를 기반으로 Feature Engineering을 진행했습니다.지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - Feature Engineering (성공편)지난 글에서는 EDA를 통해 각 데이터의 특성을 분석하여데이터 전처리 방법과 파생 Feature 아이디어를 얻어냈습니다. 지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDAhere-lives-mummy.tistory.com 이번 글에서는 완성한 모델에 최적화된 hyperparameter와 앙상블 방법을 찾는 Tuning 과정을 보여드리겠습니다. Hyperpa.. 2025. 3. 3. [데이콘 대회후기] 부동산 허위매물 분류 해커톤 10등 달성 후기 2025년 첫 머신러닝 대회,'부동산 허위매물 분류 해커톤'에서 최종 10등을 차지했습니다! 그런데그런데 말입니다...이 코드, public score가 무려......... 95등이었습니다미친 Shake-up 하ㅏㅏㅏ이것이 바로 나의 도파민이 맛에 하는 데이터사이언스 하는 거거든요 107 submission이나 되고 왜 이 점수 밖에 못 냈냐! 라고 하시는 분들이 계실텐데요,사실 초반 50개의 submission에서 제가 멍청하게 Binary Classification으로 설정해야 하는 걸Regression으로 설정했기 때문입니다... 쉽게 말해서 Threshold 적용을 안 시켜 50 submission을 날렸습니다........ 어쩐지 점수 뒤1지게 안오르더라 각설하고 오늘은 이번 대회를 돌리.. 2025. 3. 1. [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDA (3): Object type Feature EDA 이번 포스트에선 object type feature의 EDA를 수행해보겠습니다. 지난 글: [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 3등 풀이 - EDA (1): Numeric Feature EDA오늘은 저번 포스트에서 뽑은 Numeric feature 들의 feature 중요도를 기반으로 본격적인 EDA에 들어가겠습니다. 지난 글 https://here-lives-mummy.tistory.com/15 [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경here-lives-mummy.tistory.com 데이터에서 주어진 Object Type Feature는 다음과 같습니다:city : 도시 이름dong: 행정동 이름jibun: 지번apt: 아파트 이름addr_kr:.. 2025. 1. 28. [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 2등 풀이 - EDA (1): Numeric Feature EDA 오늘은 저번 포스트에서 뽑은 Numeric feature 들의 feature 중요도를 기반으로 본격적인 EDA에 들어가겠습니다. 지난 글 https://here-lives-mummy.tistory.com/15 [ML 대회 해설] Dacon 아파트 실거래가 예측 AI 경진대회 7등 풀이 - 소개 (2): Numeric Feature 톺아보기저번 포스트에 이어, 이번 포스트에선 주요 Feature와 Numeric feature의 개요를 간단히 살펴보겠습니다. 지난 글https://here-lives-mummy.tistory.com/10 [ML 대회 튜토리얼] Dacon 아파트 실거래가 예측 AI 경진대here-lives-mummy.tistory.comFeature 중요도 분석XGBoost, CatBoost의.. 2025. 1. 11. [머신러닝 대회 입문] 머신러닝 Workflow: 머신러닝이란? 머신러닝 과정, 데이터 분석하기 (1) 머신러닝을 입문할 때 가장 어려움을 겪는 부분은 어떻게 모델을 학습시키는지, 그 방법을 정립하는 단계입니다. 최근 머신러닝에 대한 관심이 집중되며 다양한 머신러닝 관련 아티클이나 서적을 다수 찾아볼 수 있습니다만, 정작 좋은 모델을 만들기 위한 일관된 Workflow에 대한 정보는 찾기 어렵습니다.저 역시 이 과정을 이해하고, 저만의 방법을 정립해 체화하는데에 오랜 시간이 걸렸는데요, 오늘은 머신러닝, 특히 머신러닝 대회에 입문하는 초보를 위한 ML Workflow를 설명하겠습니다. 이 내용은 일반 머신러닝 뿐 아니라 딥러닝에도 적용됩니다! 큰 도움이 되길 바래요 ;) * 주의: 이 글은 입문자를 위해 머신러닝의 개념을 알기쉽게 의역한 부분이 다소 존재합니다.머신러닝이란?머신러닝이란, 데이터로부터 패턴을.. 2025. 1. 4. [Kaggle 대회후기] Exploring Mental Health Data 상위 8% 달성 2024년 Kaggle Playground Series, 시즌 4 Episode 11 대회인 "Exploring Mental Health Data"의 상위 8% 에 석권했습니다! 학기 중인데다 졸업연구까지 겹치는 바람에 후반갈수록 즐겜모드 되어서 하이퍼파라미터 튜닝도 못 하고 제출했는데 오랜만에 상위권에 랭킹해서 매우행복합니다 흫흐흐흐흫 사실 이전에 각잡고 참여했던 두 Playground 대회에서 Shake-up으로 점수가 떡락하는 쓰라림을 맛보며 조금씩 슬럼프가 왔던 것 같아요. 그랬는데 이렇게 좋은 점수가 나와줘서 넘나 행복합니다... ♥ ♥ 풀이과정은 방학 즈음에 가져오겠습니다! 2024. 12. 2. 이전 1 2 다음