한 개만 더, 한 발만 더

어제보다 조금 더 나은 오늘을 만들기 위해 노력합니다.

데이터 분석

more

[Dacon] 고객 대출등급 분류 해커톤

결과 - Private 등수는 98등, 백분율로는 상위 13% 정도 수준을 달성했다. AutoML을 사용하지 않는 제한 조건이 있었던 대회라서 XGB, LGBM, CatBoost를 사용했다. 배운 점 - '네이버 부스트코스 AI 엔지니어 기초 다지기' 코스를 듣고 있는데, 여기서 배우는 내용과 캐글 책에 나오는 노트북을 보면서 노트북 자체를 좀 더 가독성 있게 구성하고, 구조를 더 잘 만들어보려고 노력했다. 이번에 더 나아진지는 모르겠으나 다음에는 좀 더 잘할 수 있을 것 같다. 아쉬운 점 - 핑계를 대 본다면.. 회사 업무에 필요한 자격증을 하나 급하게 따야 해서 공부하느라 초반에 제출한 이후로 분석을 더 못했다. 하지만 언제나 새로운 할 일은 계속해서 생기는 법이다. 시간 관리를 좀 더 잘해 보자. ..

데이터 분석 2024.02.08 0

Gradio와 GPT를 활용한 영어 교육 서비스 만들기

요즘 딥 테크 문샷이라는 프로그램을 이수하는 중이다. 프로그램에서 조별 과제를 진행하면서 Gradio라는 서비스를 알게 되어 간단하게 포스팅해보려고 한다. Gradio https://www.gradio.app/ Gradio Build & Share Delightful Machine Learning Apps www.gradio.app Gradio는 누구나 어디서나 사용할 수 있도록 친숙한 웹 인터페이스로 기계 학습 모델을 시연하는 가장 빠른 방법이라고 공식 홈페이지에서 소개하고 있다. 허깅페이스나 Streamlit과는 또 다르다. 블록을 쌓아서 아주 쉽게 모델을 만들 수 있고, 특히 GPT를 활용한 생성형 서비스를 쉽게 만들 수 있다. 우리가 만든 서비스 조별 과제를 진행하면서 생성형 API를 이용해서 간..

데이터 분석 2023.09.19 2

[Dacon] Basic 흡연 여부 예측 AI 경진대회

회고 이번 대회에서는 제출을 3번밖에 하지 못했지만 Private 점수 11등이라는 좋은 성적을 거뒀습니다. Basic 대회이고 참여한 사람 수가 200명 미만이지만, 상위 7% 내에 들어왔다는 점이 개인적으로 기분이 좋습니다. '흡연 여부 예측'이라는 주제가 흥미로워서 여러가지 Feature Engineering을 해보고 싶었는데 회사 일과 사이드 프로젝트가 한창 바쁜 주간이라 대회 참여가 뒷전이 되었네요. 중구난방으로 분석을 진행하지 않고 좀 더 체계적으로 프로세스를 만들어보고 싶어서 오라일리의 책도 구매했는데, 전체적으로 정리하면서 적용해 보기에 좋은 것 같습니다. 이번 대회에서는 AutoML을 적용해 보는 게 목표였습니다. 저는 AutoGluon을 써봤는데 확실히 효율이 좋은것 같습니다. Grid..

데이터 분석 2023.08.30 0

에러 코드

more

[Github Gist] 티스토리 블로그에 주피터 노트북 올리는 법

티스토리에 주피터 노트북을 올리는 방법은 여러 가지가 있지만, 그 중에서 Gist와 Nbviewer를 사용하는 방법이 가장 간단한 것 같다. Github에서 버전 관리를 하고 있지 않거나 Gist를 써보지 않았더라도 5분 이내로 할 수 있다. 심지어 Nbviewer 사이트에는 접속하지 않아도 된다. 아래의 Github Gist와 Nbviewer에 대한 설명은 참고만 하면 된다. ※ HTML로 변환해서 올리는 것은 줄 수 제한 때문에 짧은 코드가 아니면 어렵다. 🤷‍♂️ Github Gist란? - 코드 스니펫(조각)을 만들어 간단하게 공유할 수 있는 툴이다. https://gist.github.com/ Discover gists GitHub Gist: instantly share code, notes, ..

에러 코드 2023.08.01 0

[github] git push가 되지 않을 때 - error: RPC failed;

잠들기 직전, 오늘 작업한 코드를 git에 push하려고 했다.. 그런데 에러 코드가 떴다. 구글링으로 몇 가지 시도해 봤는데 해결이 안 된다. 자고 내일 해결해도 되지만 뭔가 찝찝해서 자기 전에 꼭 고치고 싶다. 어떻게 해야 할까? 에러코드 git push -u origin master Enumerating objects: 15, done. Counting objects: 100% (15/15), done. Delta compression using up to 8 threads Compressing objects: 100% (12/12), done. Writing objects: 100% (12/12), 1.79 MiB | 16.18 MiB/s, done. Total 12 (delta 5), reuse..

에러 코드 2023.01.26 0

[AWS] Free Tier임에도 돈을 내는 사람

아마존에서 8.18달러를 걷어갔다. 환율도 많이 올랐는데.... 배포 연습을 하면서 EC2 인스턴스 하나를 중지해 뒀는데, 예전에도 그냥 중지해둔 적이 있어서 별로 신경쓰지 않았었다. 그러나 이번에는 탄력적IP에 인스턴스를 연결해 두었고, 이것이 원인인 듯 하다. IT팀 차장님께 여쭤봤더니 탄력적IP 자체가 과금 대상인 것으로 알고 있다고 하셨다. 정확한 파악을 위해 찾아봤다. AWS 홈페이지에 따르면. 탄력적IP 주소는 몇 가지 조건 하에서 비용이 발생하지 않고, 해당 조건을 충족하지 못하면 시간당 요금이 발생한다고 한다. 아래는 AWS 홈페이지에 있는 내용이다. 모든 인스턴스를 종료했는데, 탄력적인 IP 주소에 대해 요금이 부과되는 이유는 무엇입니까? 최종 업데이트 날짜: 2020년 3월 27일 Am..

에러 코드 2020.04.03 0

생각들

more

커피챗 서비스 종료

(주)커피챗에서 운영하는 커피챗 서비스가 2025년 2월 7일자로 종료된다는 내용의 메일을 받게 되었다. 마지막 커피챗을 진행한 게 불과 3일 전이라 갑작스러웠고, 이내 곧 아쉬움이 밀려왔다. 이 서비스가 아니더라도 종종 링크드인 등을 통해 알게 된 사람들과 커피챗을 하게 되는데, 내가 링크드인에서 적절한 프로필을 가진 분을 찾아서 연락하고 시간을 조율하는 등의 번거로움이 존재한다. 하지만 커피챗 서비스는 일련의 과정을 프로세스화하여 편리하게 대화가 가능하며, 커피챗 신청을 받은 전문가에게 소정의 보상(30분 기준 13,000원)을 제공하여 참여율을 높이고 있기도 하다.   나는 서비스 출시 초기부터 가입하고 여러 번 커피챗을 진행하며 많은 도움을 받았다. 2022년 초 부터이니 커피챗을 사용한 지도 만..

이런저런 생각들 2025.01.17 0

책을 읽는다는 것

나는 일 년에 평균적으로 약 100권 정도의 새로운 책을 읽는다. 어떤 분야에 관심이 있는지에 따라 더 많이 읽기도 하고, 더 적게 읽기도 한다. 때로는 빠르게 책을 읽으며 많은 정보를 섭렵하고 싶기도 하고, 때로는 뜨거운 커피를 마시듯 아름다운 문장을 음미하고 싶기도 하다. 내가 읽은 책 중 가장 아름다운 책을 꼽으라면, 한 치의 망설임도 없이 블라디미르 나보코프의 '롤리타'와 보우밀 흐라발의 '너무 시끄러운 고독'을 선택하겠다. 이 책들을 읽으면 그 문장의 아름다운 선율로 인해 귀가 간질간질해진다. 눈으로 볼 수 있는 최고의 음악이다. 몇몇 책은 늘 가까이 두고 계속 반복해서 읽는다. 마르쿠스 아우렐리우스의 '명상록'은 고등학생 때부터 책상에 두고 생각날 때마다 한두 페이지씩 읽는다. 니콜로 마키..

이런저런 생각들 2024.08.16 0

가난한 사람

회사에서 일을 하다 보면 지나치게 타 부서의 동료와 업무를 폄하하고 의심하는 사람이 있다. 그들은 매우 보수적으로 업무를 진행하며 불필요한 부분까지 의심하고 검증한다. 그들은 자꾸만 프로세스를 복잡하게 만들고, 아주 사소한 일까지 보고받고 또 보고하기만 하며 결코 실행하지 않는다. 이러한 행동은 조직을 지금과 비슷한 수준으로 유지하거나 서서히 망하게 하기 때문에 잘 드러나지 않으며, 최고경영진에게는 오히려 꼼꼼하고 일 잘하는 사람으로 비춰질 가능성도 있다. 하지만 이는 명백히 조직의 성장을 저해하는 태도이다. 이런 사람이 1명이라도 있는 한 그 조직이 혁신을 이루어 낼 가능성은 현저히 낮아진다. 상방은 막혀 있고 하방은 열려 있는 구조라고 볼 수 있다. 그들은 작은 회사가 아니라 '큰 회사'에서는 이렇게..

이런저런 생각들 2024.05.24 0

일일 회고

more

#241126 #일일회고

기분 점수: 8 오늘 한 일- 대학원 저녁 수업. 디지털 헬스케어 실용화 마지막 과제에 집중하는 중.- 교수님께 석사학위논문 연구계획서 송부.- Cursor AI와 Replit 등 최근 트렌드 알아보기 내일 할 일- Cursor AI 입문 해보기 기타- 이번학기 대학원 수업을 화목토로 신청했는데, 생각보다 빡빡하다. 지난학기에 토요일 아침부터 저녁까지 수업 들었던 걸 생각해서 평일 수업으로 잡았는데 오히려 '회사원-개인-대학원생-사이드잡' 모드를 매일매일 시간 단위로 전환하는 게 생각보다 힘든 일인 것 같다. 삶을 더 단순하게 유지하고 적은 목표에 집중해야겠다는 생각이 든다. 연말이 되었으니 올해 회고를 진행하면서 늘어난 관심사를 재정비하고 에너지를 뾰족하게 유지할 수 있도록 해야겠다. 그래도 다음학기부..

일일 회고 2024.11.27 1

#240816 #일일회고

기분 점수: 9 오늘 한 일- 웹3와 블록체인, 금융 공부. 코인이나 토큰을 떠나서 정말 웹3와 블록체인이 미래가 될 수 있을까?- '자본주의: EBS 다큐 프라임' 책 읽기. 우리 사회와 자본주의가 어떻게 돌아가는지 깨달은 게 많다. 내일 할 일- 1인 브랜드&콘텐츠 책 읽기- 1가지 주제로 블로그/유튜브/인스타 채널 1개씩 만들기  느낀 점- 요즘 수영, 테니스, 축구에 시간을 더 많이 쓰느라 헬스장 갈 시간이 없다. 마침 연간회원권도 끝났는데 요가를 다시 시작해봐야겠다.

일일 회고 2024.08.16 0

#240528 #일일회고

기분 점수: 9 오늘 한 일- 데이콘 웹 광고 클릭률 AI 경진대회를 하고 있는데, 영 점수가 개선되지 않는다.- 드디어 이력서 업데이트를 마무리했다. 내일 할 일- 경진대회는 코랩으로 바꿔서 다시 돌려보기- 이번주 내로 프랑스 영상 마지막편 업로드하기 느낌- 다른 분야의 사람들을 만나서 이야기를 들으면 언제나 자극이 된다. 다들 각자의 영역에서 전문성을 구축해나가는 것을 보면서 나도 그 열정을 배우게 된다. 예전에는 비교를 많이 하며 조급해했던 것 같은데 요즘은 조금 더 차분해졌다. 각자의 맥락을 더 객관적으로 바라보게 되었고, 그저 남들을 쫓아가려하기보다는 내 상황에서 할 수 있는 최선이 무엇인지 다시 한번 생각해보게 된다.- 요즘 토탈풋볼 유튜브를 많이 보는데 이런 이야기가 나온다. "축구 실력이 ..

일일 회고 2024.05.29 0