We will find a way. We always have.

고려대학교에서 인공지능과 금융공학을 연구하고 있는 어느 대학원생의 블로그입니다.

동아리 및 공모전 활동

[공모전] 내가 이번 빅콘 2020 결선에서 떨어진 이유

MinsukSung 2020. 12. 1. 20:20

오늘 홈페이지를 들어가니 결과가 나왔다. 이번 빅콘은 불합격했다.

 

작년 2019년 빅콘테스트 최우수상까지 받은 나로서는 조금 당황스러웠다. 사실 작년에 받은 상으로 인한 자만심이 있었던 것은 아닐까 생각한다. 당연히 이번 결선도 붙을 것이라고 생각했기 때문이다. 열심히 반성하고 있다.

 

2019 빅콘테스트 퓨처스리그 수상 결과

 

 

빅콘테스트

기업에서 실제 보유하고 있는 데이터를 자유롭게 활용하여 새로운 비즈니스 모델 및 참신한 아이디어를 제시하고, 빅데이터 인재발굴을 통한 청년 취업 기회를 제공

www.bigcontest.or.kr

 

나름 데이터 분석을 한다고 생각했는데, 심사위원들은 다르게 생각했나보다. 실패는 성공의 어머니라고 하지 않는가. 이번을 계기로 다시 발전할 수 있도록 실패수기를 담아본다. 특히 준비 과정에서부터 결선 심사까지 이야기를 담아보고자 한다.


참여 부족

변명을 하자면, 이번에는 작년과 다르게 대학원을 와서 조금 바빴다. 매주 있는 코스웍 발표와 교수님 랩미팅과 다른 공모전의 준비 때문이다. 작년에도 물론 바빴지만, 처음이었고 정말 신기했고 재미있었다. 그래서 정말 새벽까지 열심히 했었는데, 올해는 그정도로 열심히 하진 않았다. 공모전을 많이 해보니까 수상 여부는 정말 투자한 노력에 따라 달라진 것 같다.


성능 부족

솔직히 1000팀 넘게 지원했는데, 우리 팀이 18등 안에 들어간 것도 용했다. 그렇게 생각한 이유는 검증 데이터셋의 성능때문이었다. 성능 지표로는 MAPE가 주어졌는데, 우리 팀은 대략 0.51 정도가 나왔다. 다른 친구네 팀의 성능이 0.38~0.45로 나왔던 걸 기억해보면 정말 이상했다. 머신러닝 모델로 그런 성능이 나왔는데 우리 팀은 딥러닝 모델로 겨우 0.51을 만들어서 냈으니...사실 대회측에서도 만든 피처들이 비슷하니 모델을 보겠다고 했는데, 오버피팅을 무서워해서 우리는 너무 가볍게 3층 DNN 모델을 쓴게 화근이 아닌가 싶다. 내년에는 기똥차는 피처말고도 다른 팀과 차이를 줄 수 있게 모델링 공부를 조금 더 해야겠다. 솔직히 근데 데이터 3만개 주고 대회를 주최한게 아이러니하긴 하다. 그 흔한 MNIST나 CIFAR-10 데이터셋들도 몇만개씩 되는데...


공부 부족

결정적으로 결선 심사에서 우리 팀은 주어진 과제를 시계열로 보지 않았다. 이 점이 정말 마음에 걸려서 시계열 데이터를 판단하는 기준들(?)을 나름 공부해갔다. 하지만 심사위원 중 한분이었던 동덕여대 모 교수님의 호된 혹평이 이번 결선 탈락의 결정적인 요인이었던 것 같다. 아직도 그 혹평이 머릿 속에 기억남는다. 솔직히 이번 기회로 통계학쪽 교수님들에 대한 반감이 생길 것 같다. 너무 보수적이고 폐쇄적이다. 본인이 인공지능에 대해서 잘 아시는 것 아니면서 통계적으로는 맞지 않다고 우겨대는 그 모습이 너무 꼴보기 싫다.

 

그게 시계열 데이터의 요소인가요? (콧웃음) 네 내년에 다시 공부해오세요.
아 그쪽 대학원에서는 그렇게 가르치던가요? 
통계학과가 아니라 모르는건가..?

대회를 하면서 아쉬운 점

나름 우리 팀 발표자료는 멋깔나게 잘 준비했다. 정말 정성을 많이 들였다. 특히 자연어처리 파트는 한달동안 같이 상품명 1,800여개를 하나하나 전처리하면서 단어 사전을 구성했다. 솔직히 그래서 장려상은 받을 줄 알았다. 근데 무언가 부족하니까 우리 팀을 탈락시킨 것이겠지...

 

.

.

.

 

P.S. 우리 팀의 자료가 향후 빅콘 수상할 후배들에게 도움이 되길...

 

2020 BigContest Champion's League - Team KUAI

Slideshare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our User Agreement and Privacy Policy. Slideshare uses c

www.slideshare.net