결과
- Private 등수는 98등, 백분율로는 상위 13% 정도 수준을 달성했다. AutoML을 사용하지 않는 제한 조건이 있었던 대회라서 XGB, LGBM, CatBoost를 사용했다.
배운 점
- '네이버 부스트코스 AI 엔지니어 기초 다지기' 코스를 듣고 있는데, 여기서 배우는 내용과 캐글 책에 나오는 노트북을 보면서 노트북 자체를 좀 더 가독성 있게 구성하고, 구조를 더 잘 만들어보려고 노력했다. 이번에 더 나아진지는 모르겠으나 다음에는 좀 더 잘할 수 있을 것 같다.
아쉬운 점
- 핑계를 대 본다면.. 회사 업무에 필요한 자격증을 하나 급하게 따야 해서 공부하느라 초반에 제출한 이후로 분석을 더 못했다. 하지만 언제나 새로운 할 일은 계속해서 생기는 법이다. 시간 관리를 좀 더 잘해 보자.
아무튼 아쉬운 점은,
1. 하이퍼파라미터 튜닝을 전혀 못했다.
2. 컬럼을 결합해서 피쳐 엔지니어링을 더 진행해보고 싶었는데 진행하지 못했다.
3. 앙상블 적용을 하고 싶었으나 단일 모델만을 사용했다.
향후 계획
- AutoML/Pipeline 책 사놓고 첫장만 읽은 채로 진도를 못 나가고 있다. 3월 중순부터는 계획 세워서 차근차근 읽어보자.
- 다음 대회에서는 앙상블 적용해서 결과 제출해보기
코드
출처: https://toypanda.tistory.com/235 [강영재의 블로그:티스토리]
'파이썬 > 데이터 분석' 카테고리의 다른 글
Gradio와 GPT를 활용한 영어 교육 서비스 만들기 (2) | 2023.09.19 |
---|---|
[Dacon] Basic 흡연 여부 예측 AI 경진대회 (0) | 2023.08.30 |
[Dacon] Basic 풍속 예측 AI 경진대회 (0) | 2023.07.31 |
[공공데이터] 지하철 승하차 데이터 분석 (0) | 2023.07.21 |
[Dacon] 영화 관객 수 예측 경진대회 (0) | 2023.04.04 |