한 개만 더, 한 발만 더

어제보다 조금 더 나은 오늘을 만들기 위해 노력합니다.

데이터 분석

more

[Dacon] 고객 대출등급 분류 해커톤

결과 - Private 등수는 98등, 백분율로는 상위 13% 정도 수준을 달성했다. AutoML을 사용하지 않는 제한 조건이 있었던 대회라서 XGB, LGBM, CatBoost를 사용했다. 배운 점 - '네이버 부스트코스 AI 엔지니어 기초 다지기' 코스를 듣고 있는데, 여기서 배우는 내용과 캐글 책에 나오는 노트북을 보면서 노트북 자체를 좀 더 가독성 있게 구성하고, 구조를 더 잘 만들어보려고 노력했다. 이번에 더 나아진지는 모르겠으나 다음에는 좀 더 잘할 수 있을 것 같다. 아쉬운 점 - 핑계를 대 본다면.. 회사 업무에 필요한 자격증을 하나 급하게 따야 해서 공부하느라 초반에 제출한 이후로 분석을 더 못했다. 하지만 언제나 새로운 할 일은 계속해서 생기는 법이다. 시간 관리를 좀 더 잘해 보자. ..

데이터 분석 2024.02.08 0

Gradio와 GPT를 활용한 영어 교육 서비스 만들기

요즘 딥 테크 문샷이라는 프로그램을 이수하는 중이다. 프로그램에서 조별 과제를 진행하면서 Gradio라는 서비스를 알게 되어 간단하게 포스팅해보려고 한다. Gradio https://www.gradio.app/ Gradio Build & Share Delightful Machine Learning Apps www.gradio.app Gradio는 누구나 어디서나 사용할 수 있도록 친숙한 웹 인터페이스로 기계 학습 모델을 시연하는 가장 빠른 방법이라고 공식 홈페이지에서 소개하고 있다. 허깅페이스나 Streamlit과는 또 다르다. 블록을 쌓아서 아주 쉽게 모델을 만들 수 있고, 특히 GPT를 활용한 생성형 서비스를 쉽게 만들 수 있다. 우리가 만든 서비스 조별 과제를 진행하면서 생성형 API를 이용해서 간..

데이터 분석 2023.09.19 2

[Dacon] Basic 흡연 여부 예측 AI 경진대회

회고 이번 대회에서는 제출을 3번밖에 하지 못했지만 Private 점수 11등이라는 좋은 성적을 거뒀습니다. Basic 대회이고 참여한 사람 수가 200명 미만이지만, 상위 7% 내에 들어왔다는 점이 개인적으로 기분이 좋습니다. '흡연 여부 예측'이라는 주제가 흥미로워서 여러가지 Feature Engineering을 해보고 싶었는데 회사 일과 사이드 프로젝트가 한창 바쁜 주간이라 대회 참여가 뒷전이 되었네요. 중구난방으로 분석을 진행하지 않고 좀 더 체계적으로 프로세스를 만들어보고 싶어서 오라일리의 책도 구매했는데, 전체적으로 정리하면서 적용해 보기에 좋은 것 같습니다. 이번 대회에서는 AutoML을 적용해 보는 게 목표였습니다. 저는 AutoGluon을 써봤는데 확실히 효율이 좋은것 같습니다. Grid..

데이터 분석 2023.08.30 0

에러 코드

more

[Github Gist] 티스토리 블로그에 주피터 노트북 올리는 법

티스토리에 주피터 노트북을 올리는 방법은 여러 가지가 있지만, 그 중에서 Gist와 Nbviewer를 사용하는 방법이 가장 간단한 것 같다. Github에서 버전 관리를 하고 있지 않거나 Gist를 써보지 않았더라도 5분 이내로 할 수 있다. 심지어 Nbviewer 사이트에는 접속하지 않아도 된다. 아래의 Github Gist와 Nbviewer에 대한 설명은 참고만 하면 된다. ※ HTML로 변환해서 올리는 것은 줄 수 제한 때문에 짧은 코드가 아니면 어렵다. 🤷‍♂️ Github Gist란? - 코드 스니펫(조각)을 만들어 간단하게 공유할 수 있는 툴이다. https://gist.github.com/ Discover gists GitHub Gist: instantly share code, notes, ..

에러 코드 2023.08.01 0

[github] git push가 되지 않을 때 - error: RPC failed;

잠들기 직전, 오늘 작업한 코드를 git에 push하려고 했다.. 그런데 에러 코드가 떴다. 구글링으로 몇 가지 시도해 봤는데 해결이 안 된다. 자고 내일 해결해도 되지만 뭔가 찝찝해서 자기 전에 꼭 고치고 싶다. 어떻게 해야 할까? 에러코드 git push -u origin master Enumerating objects: 15, done. Counting objects: 100% (15/15), done. Delta compression using up to 8 threads Compressing objects: 100% (12/12), done. Writing objects: 100% (12/12), 1.79 MiB | 16.18 MiB/s, done. Total 12 (delta 5), reuse..

에러 코드 2023.01.26 0

[AWS] Free Tier임에도 돈을 내는 사람

아마존에서 8.18달러를 걷어갔다. 환율도 많이 올랐는데.... 배포 연습을 하면서 EC2 인스턴스 하나를 중지해 뒀는데, 예전에도 그냥 중지해둔 적이 있어서 별로 신경쓰지 않았었다. 그러나 이번에는 탄력적IP에 인스턴스를 연결해 두었고, 이것이 원인인 듯 하다. IT팀 차장님께 여쭤봤더니 탄력적IP 자체가 과금 대상인 것으로 알고 있다고 하셨다. 정확한 파악을 위해 찾아봤다. AWS 홈페이지에 따르면. 탄력적IP 주소는 몇 가지 조건 하에서 비용이 발생하지 않고, 해당 조건을 충족하지 못하면 시간당 요금이 발생한다고 한다. 아래는 AWS 홈페이지에 있는 내용이다. 모든 인스턴스를 종료했는데, 탄력적인 IP 주소에 대해 요금이 부과되는 이유는 무엇입니까? 최종 업데이트 날짜: 2020년 3월 27일 Am..

에러 코드 2020.04.03 0

생각들

more

침묵은 어떻게 조직의 성과를 갉아먹는가?

24년 4월, 대학원에서 오후 수업 대신 세미나가 열렸고 KIST(한국과학기술연구원) 윤석진 원장님께서 오셔서 강연을 해주셨다. 강의 내용은 KIST의 역사와 역할, 한국 과학기술의 발전사와 미래, 원장님의 리더십에 대한 내용이 주를 이루었다. 과학기술 관련 대학원에 다니고 있지만 기초과학 연구와 관련된 내용은 잘 몰랐는데, KIST의 역사를 중심으로 한국의 과학기술 연구에 대해 알 수 있어서 재미있었다. 무엇보다도, 연구원들이 성과를 내기 위해 어떻게 조직 구조와 성과 제도 등의 개편 성과에 대해 설명해 주셨는데 무척 인상깊었다. 원장님께서는 나의 아버지 세대이신데도 불구하고 원장으로 재임하시는 동안 연구 성과 향상을 위한 실질적인 정책들을 실행하셨고 실제 숫자로 성과가 나타난 것이 흥미로웠다. 누구..

이런저런 생각들 2024.04.17 3

거인의 어깨 위에서

“내가 더 멀리 보았다면 이는 거인들의 어깨 위에 올라 서 있었기 때문이다.” ―아이작 뉴턴 이 문장은 아이작 뉴턴이 1676년 로버트 훅에게 보내는 편지에 인용하며 널리 알려졌다. 일반적으로 그의 겸손함을 나타낼 때 곧잘 인용되는 문구이지만, 사실은 편지 받는 사람을 비아냥거리기 위해 인용한 문구였다는 의견도 있으며, 뉴턴이 처음으로 한 말은 아니라고 한다. 하지만 이런 이야기들의 진위 여부를 따지는 것은 삶에 큰 도움이 되지 않는다. 우리는 이 문구가 보편적으로 전달하고자 하는 바를 이해하고, 내 삶에 투영하여 삶을 조금이라도 변화시키면 된다. 대학원에 입학하여 논문을 쓰게 되면서 교수님과 선배들께 듣는 말이 있다. 내가 하고자 하는 연구, 쓰고자 하는 논문으로 세상을 바꾸기려 하기보다는 이제까지 ..

이런저런 생각들 2024.03.18 0

10주 동안의 치열했던 프로젝트

2023년 8월 26일부터 11월 4일 데모데이까지, 10주간 '딥 테크 문 샷 프로젝트'에 참여했다 (이하 DMP). DMP는 혁신가 교육, 팀빌딩 및 창업, MVP 지원, 데모데이를 통해 10년 내 10억 명의 사람들에게 선한 영향력을 미칠 수 있는 기업을 길러내는 것이 목적이다. 그래서 특히 Grand Challenges 해결에 주목한다. DMP는 과기부에서 주관하고 Tide Envision University에서 운영하는 프로그램으로, 10주간 매주 화/목 저녁, 토/일 종일 정규 교육을 진행하고 나머지 시간에는 창업 프로젝트를 수행했다. 회사에서 일하는 시간 외의 모든 시간을 DMP에 사용했고, 인생에서 손에 꼽을 만큼 밀도 높은 10주를 보냈다. 나는 EO 채널에서 영상을 보고 지원했었고, 서..

이런저런 생각들 2023.11.07 0

일일 회고

more

#240414 #일일회고

기분 점수: 8 오늘 한 일 - 파리 영상 편집이 이제야 끝났다. 내일 할 일 - 아티스트 웨이 읽기. - 이번 소득 예측 해커톤 성적이 영 별로다. 다른 사람들 코드 보면서 다시 한번 공부하기! 기분 - 하고싶은 건 많고, 시간은 영 없다. 어떻게 해야 지금보다 더 효율적으로 시간을 쓸 수 있을까? 아니, 사실 할 일의 수를 줄이고 싶다. 워렌 버핏은 집중해야 할 일을 5개로 줄이라고 하는데 아무리 줄여도 5개가 넘어간다. 이 모든 게 나의 욕심인걸까? 이루지 못할 목표만을 좇고 있는지 모르겠다. 하지만 지금 이 순간 최선을 다하는 것 외엔 대안이 없다. 이렇게 일기를 쓸 때 한번씩 고민해 볼 뿐. 오늘도 아무튼 어제보다 한발 더!

일일 회고 2024.04.15 0

#240326 #일일회고 #큰 물에서 놀기

기분 점수: 9 오늘 한 일 - 데이콘 해커톤 참가 중인데 이번에 점수가 유난히 잘 올라가지 않는다. 어려운 점은 숫자형 변수가 아니라 object가 많으니까 어떻게 손 대야 할 지 어렵고, 심지어 데이터 내용이 낯설다 보니 해석 자체가 쉽지 않다. 그래도 재밌다. - 논문 리뷰 : IT기반 창업기업의 초기 투자유치와 성장에 영향을 미치는 요인에 대한 탐색 연구 내일 할 일 - 데이콘 점수를 조금이라도 올려 보자! - 논문 리뷰 과제 마무리 느낀 점 - 어제 유튜브에서 '큰 물에서 놀아야 한다'는 내용을 감명깊게 봤다. 고등학교 시절부터 cosmopolitan이라는 단어를 참 좋아했는데, 어느 순간부터는 잊고 있었다. 어려서부터 해외 각지를 돌며 살아온 사람들에 비하면 나는 우물 안 개구리다. 하지만 남..

일일 회고 2024.03.26 0

#240312 #일일회고

기분 점수: 9 오늘 한 일 - 자격증 시험을 마무리하고, 이제 대학원 1학기가 시작되었다. 우선 1학기 수업에 집중하고 논문 준비도 하고, 방학때 또 다른 간단한 자격증을 하나 준비해봐야겠다. - 데이콘 소득 예측 경진대회 EDA 진행 내일 할 일 - 대학원 수업 발표과제 발표 - 데이콘 EDA - 파리 영상 편집 기타 - 한 달간 정말 정신없이 바쁘게 살았는데 그 이후 찾아오는 여유로움이 좋다. 여유롭게 코딩도 하고 공부도 하고 하고싶은 일들 차근차근 처리해야겠다!

일일 회고 2024.03.13 0