현직자 & 실기 만점자의 빅데이터 분석기사 취득기 (1)
작년 11월부터 시작했던 빅데이터 분석기사(이하 빅분기) 취득 여정이 비로소 마무리되었습니다. 편의상 시기를 나누어 말씀드리겠습니다.
1회 필기: 취소됨
2020년 12월 19일에 빅분기 1회 필기시험이 예정되어 있었습니다. 이에 응시하기 위해 약 한 달 전부터 대비했습니다. 교재는 수제비로 선택했습니다. 선택의 이유는 레이아웃이 굉장히 깔끔하고 집필진이 큰 규모(가입자 수만 명)의 커뮤니티를 운영하고 있었기 때문입니다. 필기 공부하는 기간 내내 즐거웠습니다. 머신러닝 이론 전체를 개관할 수 있었던 점이 가장 좋았습니다. 더불어 통계학 개론을 비교적 체계적으로 살폈습니다. 장황한 글보다 수식과 도식이 익숙한 저로서는 통계학 학습이 수월했습니다. 틈틈이 나름대로 심화학습도 진행할 정도였습니다.
그러나 필기 시험은 취소되었습니다. 시험 예정일을 불과 나흘 앞둔 화요일에 취소 통보를 받았습니다. 사실 며칠 전부터 확진자가 크게 늘어 시험이 취소될지 모른다는 불안감이 확산하던 차였습니다. 그럼에도 실제로 통보를 받으니 허망하기 그지없었습니다. 불가피한 상황임은 수험자들도 공감하는 바였기에 아쉬움을 뒤로 하고 2회 시험을 기약했습니다.
2회 필기: 실질적인 첫 시험
2021년 4월 17일 토요일에 첫 필기 시험을 치렀습니다. 저는 서울 모 중학교에서 응시했습니다. 어지간히 긴장했던가 봅니다. 조그마한 불안 요소도 원천 차단하기 위해 아예 휴대전화를 집에 놓고 가겠다 마음먹고 집에서 시험 장소까지 가는 길을 외웠습니다. 고사장 근처에서 헤매긴 했지만 제시간에 도착했습니다. 20년 11월부터 금년 4월까지 약 6개월을 준비했기 때문에 솔직히 자신만만했습니다. 넉넉한 점수로 합격하리라 기대했습니다. 그러나 문제지 첫 장을 보는 순간 그 기대는 산산조각 났습니다.
필기 시험 과목은 총 네 과목으로 아래와 같습니다.
- 빅데이터 분석기획
- 빅데이터 탐색
- 빅데이터 모델링
- 빅데이터 결과 해석
첫 과목부터 막히는 문제가 꽤 많았습니다. 교재에서 다루지 않았던 내용이었습니다. 물론 이 분야 전문가들이 집필하셨겠지만 교재의 적중률이 높지 않았습니다. 첫 시험임을 감안하더라도 교재와 실제 시험 간 괴리 정도가 심했습니다. (여타 기사 시험과는 달리, 빅분기 출제기관에서는 문제를 공개하지 않고 있습니다. 게다가 퇴실 시 응시자의 시험지를 회수합니다. 따라서 기억에 의존해 복기해 적어보았습니다.)
- 제1과목: 데이터베이스, 데이터 수집과 저장, 빅데이터 분석 관련 소프트웨어에 대한 문제는 출제되지 않았던 것으로 기억합니다. 대신 개인정보보호가 중요하게 다뤄졌습니다.
- 제2과목: “통계, 통계 또 통계”로 요약할 수 있습니다. 기초통계를 넘어서는, 심도 있는 문제가 출제되었습니다. 조건부 확률, 최대우도추정, 확률분포, 통계적 검정, 표본 추출 방법(층화 추출) 등이 출제되었습니다.
- 제3과목: 교재에서 제시된 내용에서 크게 벗어나지 않았습니다. 주요 모델링 기법을 숙지하면 무난히 풀 수 있는 문제들이었습니다.
- 제4과목: 분석모형의 평가와 개선 파트가 주를 이뤘습니다. 이 분야에 대한 깊이 있는 학습이 요구됩니다. 결과 시각화 부분은 매우 평이하게 출제되었습니다.
고사장을 퇴실하면서도 합격하리란 생각은 들지 않았습니다. 나름대로 공을 들였다고 생각했던 통계 파트에서 킬러 문제(?)가 많아 적잖이 당황하고 또 제자신에게 실망했습니다. 수험생 커뮤니티에도 예상을 크게 벗어난 출제 경향을 성토하는 목소리가 줄을 이었습니다. 국가기관에서 주관하는 시험임에도 오타가 존재했고 복수 정답 시비도 있었습니다. (결국 두 문제에 대해 복수 정답이 인정되었습니다.)
불합격하리라는 판단에 다른 자격시험을 준비하기 시작했습니다. 바로 국가공인 민간시험인 ADsP(데이터분석 준전문가)였습니다. 이에 대한 내용은 다른 포스트로 다루겠습니다.
2회 실기
필기를 치르고 한 달 후, 결과가 나왔습니다. 의외로 합격이었고 기준 점수를 10점 가량 상회하는 점수를 받았습니다.
후에 듣기로는 필기 합격률 40%대를 기록했다고 합니다. 수험생과 교재 집필진의 예상을 벗어난 출제였지만 컷트라인 60점도 못 넘길만큼 어렵진 않았나 봅니다. 기쁨을 뒤로 한 채 첫 번째 실기 시험은 어떻게 나올지 촉각을 곤두세웠습니다.
제시된 문제 유형과 응시 환경만 보았을 땐 현업에서 분석, 모델링하는 환경(jupyter notebook, colab 등에서 지원되는, 라인별 실행이나 자동완성 기능)과 거리가 있을 뿐 딱히 난해할 것으로 보이진 않았습니다.
- 단답형 대비: 필기 출제 범위와 동일할 것으로 가정하고 필기 내용 요약노트를 키워드 위주로 복습했습니다.
- 작업형 1,2 유형 대비: 사실 현업에서 매일 하는 일이라 작업형 대비에 많은 시간을 할애하진 않았습니다. 예시 문제를 제약 상황(제한된 응시 환경, 실행 시간 1분 이하)하에서 푼다면, 파이프라인을 어떻게 짜야 할지 고민했습니다. 그리고 지문을 꼼꼼히 읽고 문제에서 지시하는 바를 명확히 파악한 후 결과를 도출하는 데 유념했습니다.
드디어 6월 19일. 날이 밝았습니다. 실기시험은 서울에 위치한 모 컴퓨터학원에서 진행되었습니다. 한 방에 열댓 명 정도의 수험생이 모여 시험을 치렀습니다. 단답형, 작업형 모두 평이한 수준이었습니다.
- 단답형: 부스팅, 과대적합, 신경망에서 최종 출력 구하기, 이상치, 하이퍼파라미터, 후진제거법, roc curve 등 주요 개념을 묻는 문제
- 작업형: 제1유형은 데이터 전처리 및 feature engineering / 제2유형은 분류 문제 모델링이었습니다. 따로 포스팅할 예정입니다.
시험을 마치고 나왔을 땐 참 홀가분했습니다. 합격을 넘어 좋은 점수를 기대하는 것도 무리가 아니란 생각이 들었습니다. 결과가 나오기까지 한 달이나 걸린다는 사실에 애가 탈 뿐이었습니다.
결과 발표
인고의 한 달이 지나 모든 게 결정되었습니다.
생각지도 못한 높은 점수에 너무 놀랐고 뛸듯이 기뻤습니다. 커뮤니티에 올라온 후기에 공개된 점수들은 대부분 높았습니다. 실기 시험이 매우 평이해서 만점이 흔하겠다는 생각에 약간 실망하기도 했지만, 기준 점수만 넘으면 60점이나 100점이나 아무런 차이도 없지만 그래도 좋았습니다. 기사 실기시험에서 만점이라니!
그러나 기쁨은 오래가지 않았습니다. 이번 주 월요일에 긴급공지가 떴습니다. 채점에 문제가 생겨 모든 수험생의 코드를 전수 조사한다는 것이었습니다. 채점이 잘못되어 제 점수가 달라질 수도 있다는 생각에 덜컥 겁이 났습니다. 아래 문자를 받기 전까지 계속 신경 쓰였습니다.
길고 지난한 시간이었습니다. 그럼에도 지식의 깊이를 더할 수 있었습니다. 현업과 실무에서 축적한 경험과 적절히 융합하여 한 단계 도약하겠습니다. 이어지는 포스트에서는 좀더 디테일한 내용을 적어보려 합니다!
Leave a comment