Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Tags
more
Archives
Today
Total
관리 메뉴

Altiora Petamus

[나만의 글쓰기] 5 주차 회의록 본문

SSAC X AIffel/회의록

[나만의 글쓰기] 5 주차 회의록

현석종 2021. 2. 17. 23:57

이번주 학습 내용

Fundamentals 

1. 멀티태스킹, 병렬 프로그래밍, 멀티스레드, 멀티프로세스의 이해와 응용 

 

 제 1회 Hackathon


Fundamentals

1. 멀티태스킹, 병렬 프로그래밍, 멀티스레드, 멀티프로세스의 이해와 응용 

우리가 당연하다고 생각하고 이용하던 멀티태스킹의 작동원리와 그 응용 방법을 배울 수 있었다. 평소엔 전혀 알지 못했던 정보들을 습득할 수 있었다. 컴퓨터의 작동 방식에 대하여 깊게 공부해 본적이 없던 나로서는 익숙하지 않았기에 이해하는 것이 쉽지는 않았다. 배운 내용들을 이해하고 익숙하게 다룰수 있게 된다면 프로그래밍을 하는데 있어서 더욱 높은 수준의 퍼포먼스를 발휘할 수 있을 것 같다. 

 

 제 1회 Hackathon

www.kaggle.com/c/competitive-data-science-predict-future-sales/overview

 

Predict Future Sales

Final project for "How to win a data science competition" Coursera course

www.kaggle.com

- aiffel 에서 제 1회 Hackathon을 시작하였고 수강생으로써 참여했다. 기간은 약 2틀 정도였다. kaagle은 언젠간 한번 참여해 보고 싶은 생각은 있었기에 나에게 좋은 기회가 되었다고 생각하였다. 주제는 시계열 데이터를 이용한 판매량 예측이었다.

처음엔 의기양양하게 시작하였지만 순위권에 있는 다른 분들의 코드를 참고하였을 때 약간의 벽이 느껴졌다. 정말 생각도 못한 방식으로 데이터를 전처리하는 것을 보고 "아직 멀었다"라는 생각이 들었다. 특히 놀라웠던 부분은 주어진 데이터들간의 관계를 추종해 전혀 새로운 데이터를 만들어내고 이러한 데이터가 성능 좋은 모델을 만들어 내는데 큰 역할을 하였다는 것이었다. 코드를 보고 전혀 이해하지 못할 정도는 아니었지만 그러한 아이디어를 구상했다는 것 자체가 놀라웠다. 내가 진행한 방식은 순위권에 있는 분의 코드를 참고하여 전처리 과정을 수행하고 모델의 부분에서 차이점을 두는 것이었다. 모델의 경우 lightgbm이라는 모델을 사용하였고 hyperparameter를 여러번 조정하여 가능한 좋은 성능을 내는 모델을 찾으려 노력하였다. 결과는 전체 4등을 하였다. 

 

꽤 좋은 성적을 거두었지만 한편으로는 너무 아쉽고 자괴감이 들었다. 그 첫번째 이유는 내가 생각했던 대회와는 전혀 다른 방식이었다. 순위권 팀들의 코드를 여러개 보았을 때, 전처리 과정이 대부분 같다. 이 전처리 방식이 높은 성능을 이끌어 내는데 큰 역할을 하는 것을 알게 되었기 때문에 나도 이용한 것도 있지만 모든 참가자가 나와 같은 방식으로 대회를 참여한다면 높은 순위에 있는 코드의 내용을 조금 더 높은 성능을 내도록 수정의 과정만 거치면 더 높은 순위를 차지하는 것은 얼마든지 가능하기 때문이다. 지식을 공유하는 것이 kaggle의 슬로건이지만 내가 대회에 참여한 방식은 남이 차려놓은 밥상에 숟가락을 얻어 이득을 취하려 했다고 밖에 생각이 들지 않는다. 이러한 '공유'문화가 지금의 인공지능 분야를 발전시킨 것일 수 있지만 나로썬 괜히 아쉬운 경험이었다. 

두번째 이유로는 전처리과정을 마치고 모델을 정의하고 학습시키는 과정이 그저 노동력의 결실이었다는 것이다. Hackathon은 제한된 시간에 최상의 퍼포먼스를 취하는 것이다. 시간이 제한되어 있다보니 나에겐 압박감이 생겼는지 이 대회를 통해 공부를 해야겠다는 생각보다는 그저 좀더 좋은 성능을 발휘하는 모델을 만들고 싶다는 생각이 먼저였다. 그러다보니 코드를 좀더 체계적으로 분석하고 모델을 탐구적으로 학습시키지 못한 경향이 있다. 너무 아쉬운 점이다. 결과를 떠나서 과정이 너무 지저분하다. 다른 팀들의 발표를 보았을 때, 시간도 넉넉하지 않았는데 어떻게 더 좋은 성능을 발휘하면서 분석을 잘했을까 라는 생각이 들었다. 어찌보면 당연하다고도 생각한다. 문제를 정확히 이해해야 좋은 성능을 발휘하지 않겠는가. 나는 hyperparameter를 변경하면서 그저 운에 의지한 것 같다. 이번 Hackathon대회를 계기로 매우 반성되는 점이다. 앞으로 공부하는 내용에 대하여 더욱 꼼꼼히 파고들려고 하는 습관을 들여야 할 것 같다. 개인적으로 과정에 있어서 너무나도 아쉬움이 남는 경험이었지만 결과는 만족한다. 왜냐하면 내가 지금 필요한 건 무선마우스(4등 상품)이었기 때문이다.ㅋㅋㅋㅋ


회고

아쉬움이 많이 남는 한 주 였다. 하지만 이러한 경험을 통해 나 자신의 태도를 되돌아 보고 반성할 수 있었던 건 굉장히 값진 시간이었다고 생각한다. 이제 같은 실수를 반복하지 않도록 노력하는 일만 남았다. 

 

 

Comments