현재 퇴근 후나 주말을 이용해서 머신러닝 공부를 하고는 있지만 현재 실무에서 파이썬을 사용하고 있지 않아 단순히 개인적인 공부만 하는 것에 한계를 느끼고 있었다.
그래서 자격증을 취득하면 목표도 생기고 좀 더 몰입해서 할 수 있지 않을까해서 취득하기로 결정한 빅데이터 분석 기사 자격증. 국가공인자격증이며 한국데이터산업진흥원에서 실시한다. 원래 2020년 12월 19일에 최초 시행되기로 했었으나 코로나 확산으로 시험이 취소되어 2021년에 최초 시행되었다.
물론 이 자격증이 있다고 해서 빅데이터 분석을 자유자재로 할 수 있고 데이터분석 직무로 지원할 때 프리패스인건 너무나도 당연히 아니겠지만 최소한 내가 이 분야에 관심이 있고 이론적 베이스도 탄탄하다는 걸 증명할 수는 있다.
응시자격
응시 자격이 꽤 까다로운 듯 하지만 전공무관 대졸자면 응시가 가능하다. 만약 학부생이라면 기사 자격증이 있지 않는 이상 응시 자격에서 직장 경력을 요구하기 때문에 시험에 응시하기 어려울 것 같다.
시험일정 및 접수비용
1년에 시험은 딱 2번이고 3회 필기 시험은 10월2일, 실기 시험은 12월4일에 예정되어 있다.
응시료는 필기 17,800원, 실기는 40,800원으로 진흥원에서 실시하는 다른 P자격증들 검정료에 비하면 싼 편이다.
시험 과목 - 필기
필기는 크게 빅데이터 분석기획, 탐색, 모델링, 결과해석 4개 파트, 각 20문항씩 구성되어 있다. 데이터 분석기획은 확실히 이론적인 내용으로 빅데이터 기술 및 제도 데이터 수집과 적재 등의 내용을 다룬다.
1과목, 4과목이 암기 부분이라 암기를 잘하는 사람이라면 여기서 점수를 최대한 많이 따 놔야 2,3과목에서 어려운 문제들을 만나도 합격선에 들 수 있다.
빅데이터 탐색부터 본격적인 내용인데.. 데이터 전처리(정제, 결측값, 이상치 처리), 분석 변수 처리(차원축소, 불균형 데이터 처리 등)과 통계기법에 대한 내용을 다룬다. 최초 시행되었던 2021년 제2회 필기시험에서는 예상보다 통계 관련 문제가 많이 나와서 잡음이 많았었다.
자세한 내용은 K-DATA데이터 검정자격 홈페이지에서 확인
시험 과목 - 실기
실기는 단답형과 작업형 두개 유형으로 나뉜다. 최초 시행 시험에서 단답형은 10문제가 출제되었고 필기를 열심히 했다면 충분히 맞출 수 있는 수준이었다고 한다.
R과 파이썬 중 하나를 선택해서 코드를 작성하고 제출하는데 지난 실기시험 결과, 파이썬으로 코드를 제출한 경우가 만점이 많았고 R은 0점이 많았다고 한다.
실기 시험 환경은 구름, 온코더, 프로그래머스이다.
진흥원 홈페이지에서 예시 문제와 데이터셋을 확인할 수 있다. 적어도 그 정도 수준은 풀 줄 알아야 한다.
***주의할 점
-라인별 실행, 그래프 기능, 단축키, 자동완성 기능 미제공
(help 함수는 이용 가능)
-코드 실행 시간 1분 이내
-패키지 추가 설치 불가
중요한 건 러닝타임이 1분 내여야 한다. 1분이 넘어가면 0점이다. 그렇기 때문에 모형을 선택할 때 러닝타임도 빠르면서 성능도 좋은 모형을 선택하는 것이 가장 중요하다. 랜덤포레스트가 가장 유력한 모델일 듯 하다.
또 시험에서 help 함수를 쓸 수 있기는 하지만 구름을 이용해서 실기 시험을 보기 때문에 쥬피터노트북처럼 자동완성이 안된다. 따라서 기본적으로 자주 쓰이는 라이브러리나 메서드는 외워두는 것이 필요하다. 또 패키지는 추가 설치가 불가능하며 제공되는 패키지만 사용할 수 있다.
2차 시험에서 제공되었던 패키지는 아래 txt 파일 참고
합격 기준
필기는 과락 40점, 평균 50점 이상이면 합격, 실기는 60점 이상이면 합격이다.
올해 초 처음 시행되었던 시험 기준으로 필기 합격률은 40%수준, 실기는 앞서 말한 것과 같이 점수가 양극단으로 나뉘어서 어떤 언어를 선택했냐에 따라 합격여부가 갈리는 듯 했다.
참고로 진흥원에서 제시한 제2유형(전처리)의 구간점수 기준은 아래와 같다.
0.5 < AUC <= 0.6 | 10점 |
0.6 < AUC <= 0.7 | 20점 |
0.7 < AUC <= 0.8 | 30점 |
0.8 < AUC | 40점 |
아직 한 번밖에 시험이 실시되지 않아서 정확한 시험 유형이나 기출 문제가 없다. 찾아보니 시중에 있는 문제집들도 실제 시험과 유형 차이가 많이 났다고 한다.
일단 나는 아직 공부가 미흡한 부분들이 많아 핸즈온 머신러닝과 파이썬 라이브러리를 활용한 머신러닝 책으로 기본적인 코드들을 공부한 후 시대고시 책이나 유튜브 등으로 공부할 예정이다. 올해 꼭 필기, 실기 모두 한번에 합격할 수 있길!
'파이썬 > 파이썬 기초' 카테고리의 다른 글
편향(bias) 분산(variance) 트레이드 오프와 MSE (0) | 2021.07.18 |
---|---|
지도 학습 분류와 회귀의 차이와 성능 평가 지표 (0) | 2021.07.18 |
파이썬 라이브러리 - numpy, pandas, matplotlib 등 기본 라이브러리 개념 (0) | 2021.07.17 |
사이킷런 분류기의 예측 불확실성 추정 함수 - decision_functon과 predict_proba (0) | 2021.07.05 |
axis=1 뜻, 판다스 drop함수로 간단하게 알아보기 (0) | 2021.06.27 |