Data Science

[빅분기] 빅분기 2회 실기 단답형 기출문제 본문

자격증

[빅분기] 빅분기 2회 실기 단답형 기출문제

shinho0902 2021. 11. 24. 13:51

빅데이터분석기사 2회 실기 단답형 기출문제

 

 

 

1. 데이터 정제 과정에서 처리해야 하는 값으로, 데이터가 정상의 범주에서 벗어난 값을 의미하는 것은 무엇인가?

이상치

 

 

2. 결측값 처리를 위한 단순 대치법에서 관측 또는 실험으로 얻어진 자료를 평균값으로 결측값을 대치하는 방법은?

평균대치법

 

 

3. 모델에서 외적인 요소로 데이터 분석을 통해 얻어지는 값이 아니라 사용자가 직접 설정해주거나 알고리즘 생성자가 직접 만드는 값은 무엇인가?

하이퍼 파라미터

 

4. 다음이 설명하는 개념은 무엇인가?

  - 데이터에서 표식(라벨)이 없는 경우가 많다.

  - 예측의 문제 보다는 주로 현상의 설명이나 특징추출, 패턴 도출 등의 문제에 사용된다.

  - 대표적인 기법은 군집화, 차원축소기법, 연관관계분석, 자율학습 인공신경망의 기법이 있다

비지도학습

 

 

5. 훈련 데이터에 대해서는 높은 성능을 보이지만 테스트 데이터에 대해서는 낮은 성능을 보이는 경우, 모델은  훈련데이터를 [   ] 되었다고 한다.

과(대)적합 , 오버피팅

 

 

6. 회귀 분석에서 전체 변수에서 시작하여 가장 적은 영향을 주는 변수를 하나씩 제거하는 방법?

후진 소거법(제거법)

 

 

7. 앙상블 분석에서 잘못 분류된 개체들에 가중치를 적용하여 새로운 분류 규칙을 만들고 이 과정을 반복해 최종 모형을 만드는 알고리즘?

부스팅

 

 

8. 앙상블 모형에서 다음이 설명하는 알고리즘은 무엇인가?

  - 회귀 분류 모델링에 사용되며 부스팅에 속한다

  - 경사 하강법(gradient descent)을 이용하여 가중치 업데이트하여 최적화된 결과를 얻는 알고리즘

GBM

 

 

9. 인공신경망에서 은닉층 2개, 출력층 1개인 경우 출력값은 얼마인가?

  - 마지막 은닉층의 값은 (0.2, -0.3) 이다.

  - 첫 번째 노드의 가중치는 0.3, 두 번째 노드이 가중치는 0.1 이다

  - bias가 -0.05 이고 활성화 함수는  f(x) = x , (x >= 0)  과  f(x) = -1, (x < 0)  이다.

-1

 

 

10. 혼동 행렬의 가로와 세로축을 FPR, TPR로 생성한 곡선은 무엇인가?

ROC 곡선

 

Comments