한 개만 더, 한 발만 더

어제보다 조금 더 나은 오늘을 만들기 위해 노력합니다.

데이콘 3

[Dacon] Basic 흡연 여부 예측 AI 경진대회

회고 이번 대회에서는 제출을 3번밖에 하지 못했지만 Private 점수 11등이라는 좋은 성적을 거뒀습니다. Basic 대회이고 참여한 사람 수가 200명 미만이지만, 상위 7% 내에 들어왔다는 점이 개인적으로 기분이 좋습니다. '흡연 여부 예측'이라는 주제가 흥미로워서 여러가지 Feature Engineering을 해보고 싶었는데 회사 일과 사이드 프로젝트가 한창 바쁜 주간이라 대회 참여가 뒷전이 되었네요. 중구난방으로 분석을 진행하지 않고 좀 더 체계적으로 프로세스를 만들어보고 싶어서 오라일리의 책도 구매했는데, 전체적으로 정리하면서 적용해 보기에 좋은 것 같습니다. 이번 대회에서는 AutoML을 적용해 보는 게 목표였습니다. 저는 AutoGluon을 써봤는데 확실히 효율이 좋은것 같습니다. Grid..

[Dacon] Basic 풍속 예측 AI 경진대회

회고 데이콘 Basic에 올라온 풍속 예측 AI 경진대회에 참여했다. 마감을 일주일 정도 남겨놓고 연습 삼아 참가해보게 되었는데 나름 재밌었다. 이번에 참가하면서 AutoML을 활용해보고 싶었는데 그것까지 학습해서 적용하기엔 시간이 부족했다. 다음 대회에서는 AutoML 중 하나를 골라서 적용해보는 걸 목표로 해야겠다. 이번 대회에서 아쉬운 점은 풍속과 기후에 대한 도메인 지식이 전혀 없어서 기본적인 이상치, 결측치, 스케일링 외에는 피쳐 엔지니어링에 거의 손을 대지 못한 것. 논문을 하나 구매해서 챗지피티와 함께 공부했지만 짧은 시간에 이해하는 데 한계가 있었다. 고등학교 시절 생물, 화학 말고 지구과학도 열심히 들을 걸 그랬다. 이제 상위권 랭커들의 코드가 올라올텐데 보면서 공부 많이 해야겠다! 깃허..

[Dacon] 영화 관객 수 예측 경진대회

개요 - 가짜연에서 'XGBoost와 사이킷런을 활용한 그래디언트 부스팅'이라는 책으로 세 달 가량 스터디를 진행했고, 그 이후 혼자 공부 중이다. - 책에서 배운 내용을 적용해보기 위해 데이콘 교육용 대회인 영화 관객 수 예측 경진대회를 진행했다 (회귀). http://www.yes24.com/Product/Goods/108708980 XGBoost와 사이킷런을 활용한 그레이디언트 부스팅 - YES24 캐글 우승자들의 머신러닝 우승 비법이자 현존하는 가장 우월한 머신러닝 모델 XGBoost이 책은 기본적인 머신러닝과 판다스부터 사용자 정의 변환기, 파이프라인과 희소 행렬로 새로운 데이터의 www.yes24.com 결과 [베이스 라인 코드 제출 시, Random Forest] 점수는 1383414점으로 ..