본문 바로가기

Python

직장인 비전공자 1주 합격, 8회 빅데이터분석기사 실기 합격 꿀팁(인강/교재 추천)

안녕하세요, 최근에 빅데이터분석기사 8회차 실기시험을 치르고 난 후기를 공유하고자 합니다.

이 글을 통해 시험 준비와 실제 시험에서 유용했던 팁을 가져가세요~! 

빅데이터분석기사 8회차 실기시험 후기

🖤 시험 개요

빅데이터분석기사 실기시험은 컴퓨터를 사용하여 실제 데이터 분석 작업을 수행하는 형태로 진행됩니다.

시험 시간은 총 3시간(180분)이며, 가격은 40,800원입니다. 과락 없이 전체 평균 60점 이상이면 합격입니다.

시험 과목은 다음과 같이 나뉩니다:

  1. 데이터 수집 작업
  2. 데이터 전처리 작업
  3. 데이터 모델 구축 작업
  4. 데이터 모델 평가 작업

🖤 시험 구성

시험은 3개의 작업형 문제로 구성됩니다.

  • 작업형 1: 소문제 3개, 각 10점씩 총 30점
  • 작업형 2: 1문제, 40점
  • 작업형 3: 2문제, 문제당 소문제 3개씩 각 5점*6개, 총 30점

🖤 준비 과정

저는 빅데이터분석기사 필기 -> ADSP -> SQLD -> 빅데이터분석기사 실기 이렇게 진행이 됐었기에 긴 여정으로 많이 지쳐있었어서,, 1주 동안 아주 초집쭝을 해서 해보자 ! 하고 시작하게 되었어요 !

물론 개인적으로 Pyhton에 대해 개인 프로젝트를 한 경험이 있었던 부분이 있어 1주일 평일 3시간, 주말 8시간 공부해도 가능했던 거 같습니다만, 다른 분들은 2주 투자하시고 !! 제가 추천하는 인강 및 유용한 팁 ! 주의 사항 잘 숙지해 가시면 무리 없다고 생각합니다 !

 

저는 인프런에서 '퇴근후딴짓'님의 강의를 수강했습니다. 신규 가입 시 20% 할인이 되어 7만원 중반대에 수강할 수 있었습니다.

이 강의는 초급자도 이해하기 쉽게 간단한 코드로 반복 설명해주셔서 큰 도움이 되었습니다.

또한 이전 회차들을 복원하여 시험에 대한 감을 잡기에도 좋았습니다.

강의를 듣고 꼭 해야 할 점은 두 가지입니다:

  1. 자기 주도 학습: 처음부터 끝까지 반복해서 문제를 풀어보는 것
  2. 실제 시험 환경 체험: 빅데이터분석기사 실기 테스트 체험환경에서 풀어보기

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0

 

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3) 강의 | 퇴근후딴짓 - 인프런

퇴근후딴짓 | 비전공자, 입문자가 빅데이터 분석기사 실기를 빠르게 취득할 수 있도록 안내해드려요! 꼭 필요한 파이썬, 판다스, 머신러닝을 다루고 있어요!, ❤️공지❤️ 7회 기출 유형 업데이

www.inflearn.com

 

🖤 유용한 팁

1) 작업형 2에서는 여러 가지 모델을 사용할 수 있지만,

다른 모델을 외울 필요 없이 randomforest만 사용할 줄 알면 됩니다.

저는 8회차 작업형 2에서  MAE 평가지표, 회귀 문제가 나왔고, randomforest를 사용하여 40점 만점을 받았습니다.

  • 회귀 문제: randomForestRegressor
  • 분류 문제: randomForestClassifier

2) 작업형 2에서 가장 먼저 해야할 일은 ! 회귀 문제인지 분류 문제인지 구분하는 것인데

'평가지표가 무엇인지' 살펴보면 됩니다:

회귀 문제:

  • 평균 절대 오차 (MAE)
  • 평균 제곱 오차 (MSE)
  • 루트 평균 제곱 오차 (RMSE)
  • 결정 계수 (R²)

분류 문제:

  • 정확도 (Accuracy)
  • 정밀도 (Precision)
  • 재현율 (Recall)
  • F1 스코어 (F1 Score)
  • ROC AUC * ROC AUC는 model.predict_proba()를 사용하기 ! 나머지는 model.predict()

★ 시험 전 무조건 숙지해야 되는 주의 사항 ! (매우 중요) ★

test 와 예측 결과의 데이터 개수 동일한지 확인 : ex) test 데이터 개수가 2,094개면 예측 결과 데이터도 2,094개 !


변수명 및 파일명 확인: 작업형 2에서 지정된 파일명이나 변수명을 확인하여 저장하는 것을 잊지 마세요! 
Ex) 8회차 실기시험 에서예측 결과 변수명을 'pred'로, 파일명은 'result.csv'로 지정해 주었습니다. 

변수명이나 파일명이 다르면 각 2점 감점입니다.
예시 코드) Submit = pd.DataFrame({ 'pred': pred[:, 1] })
Submit.to_csv('result.csv', index=False)
print(pd.read_csv('result.csv'))


- 시험 환경 체험하기 : 실제 빅데이터분석기사 실기 체험 테스트 화면에서 미리 연습해보는 것이 중요합니다. 변수에 바로 저장이 되지 않는 경우가 있으므로 실제 환경에서 테스트해보는 것을 추천합니다.

 

Example Domain

Example Domain This domain is for use in illustrative examples in documents. You may use this domain in literature without prior coordination or asking for permission. More information...

www.example.com

🤍 8회차 빅데이터분석기사 실기시험 복원 문제 🤍  

작업형 2 같은 경우는 저는 원핫 인코딩인 get_dummies를 사용했을 때 104였고, 하이퍼파라미터를 조정하니까 110까지 올라가서 get_dummies까지만 하고 제출하였습니다.
오히려 더 많은 작업을 할 때 예측 결과가 더 떨어질 수 있다는 점 숙지하시면 좋습니다 ! 

작업형 1
문제 1: 나라별 맥주 소비량 데이터 분석
- 대륙별로 나라를 그룹화하여 대륙별 평균 맥주 소비량을 계산
- 평균 소비량이 가장 높은 대륙을 선택
- 해당 대륙 내에서 나라별 맥주 소비량을 정렬하고, 소비량이 몇 번째인 나라의 소비량을 구하기

문제 2: 나라별 관광 데이터 분석
- 나라별로 다양한 관광 유형의 총합을 계산
- 총합 관광객 수에 따라 나라별로 정렬한 후, 특정 조건에 맞는 값을 더하는 문제

문제 3: 결측치 처리 전후 데이터 분석
- 결측치 처리 전후의 데이터를 이용해 표준편차를 각각 계산
- 결측치 처리 전후의 표준편차 차이(a-b)를 구하는 문제

작업형 2 - 회귀 문제: Mean Absolute Error(MAE)로 평가
- 랜덤 포레스트 회귀를 사용해 모델링한 후, 원핫인코딩 진행하니 MAE가 104대
- 하이퍼파라미터를 진행하니까 MAE가 110대로 올라감
- 원핫 인코딩한 랜덤 포레스트 모델로 테스트 데이터를 예측하고 제출하니 40점 만점

작업형 3
문제 3-1: 통계적으로 유의하지 않은 변수 찾기 및 로지스틱 회귀 분석
- 통계적으로 유의하지 않은 변수의 개수를 찾는 문제
- 유의한 변수들을 이용해 로지스틱 회귀 모델을 돌려서 회귀계수를 계산
- 계산된 계수 값을 바탕으로 계수가 5배 적용될 때 오즈비의 변화를 구하는 문제

문제 3-2: 다중 회귀 분석 및 예측
- OLS(최소자승법)을 사용하여 회귀계수를 구하는 문제
- 새로운 데이터에 대해 예측값을 계산하는 문제가 포함
- 오즈비 구하는 문제 

 

이 글을 읽으신 분들 모두 합격 기운 받아가세요~!  감사합니다 !