일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 워드클라우드
- 튜플
- 빅분기
- 작업형2
- 딕셔너리
- 예측모델링
- 파이썬
- 행별속성합계
- 공공빅데이터청년인턴
- 셋
- 태블로
- 실기
- 파이썬입출력
- 리스트
- 2회기출
- set시간복잡도
- 파이썬셋
- 빅데이터분석기사
- 컨테이너
- 공빅데기관매칭
- csv병합
- 공빅데
- 백준 2164
- 파이썬튜플
- 파이썬딕셔너리
- 백준1920
- 빅분기실기
- dataq
- konlpy
- 파이썬AHP
- Today
- Total
목록빅데이터분석기사 (4)
Data Science
참고 데이터 https://www.kaggle.com/kukuroo3/ecommerce-shipping-data-competition-form Commerce Shipping Data (competition form) Classification problem www.kaggle.com In [1]: import pandas as pd x_train = pd.read_csv('../input/ecommerce-shipping-data-competition-form/X_train.csv') x_test = pd.read_csv('../input/ecommerce-shipping-data-competition-form/X_test.csv') y_train = pd.read_csv('../input/ecomme..
아래는 백화점 고객의 1년 간 구매 데이터이다. 고객 3500명에 대한 학습용 데이터(y_train.csv, X_train.csv)를 이용하여 성별예측 모형을 마든 후, 이를 평가용 데이터(X_test.csv)에 적용하여 얻은 2482명 고객의 성별 예측값(남자일 확률)을 다음과 같은 형식(custid, gender)의 CSV 파일로 생성하시오. (제출한 모델의 성능은 ROC-AUC 평가지표에 따라 채점) # 데이터 읽기 import pandas as pd x_train = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/빅분기 실기/프리렉/data/x_train.csv',encoding='cp949') x_test = pd.read_cs..
* 프리렉 교재를 참고하였으며, 교재와 다른 내용이 많이 포함되어 있습니다. 고객 10,866건에 대한 학습용데이터(x_train,y_train)를 이용하여 자전거 대여량 예측 모형을 만든다. 생성한 예측 모형으로 평가용데이터(x_test)에 해당하는 6,493건의 자전거 대여량 예측값을 csv 파일로 생성하시오 (제출한 모델의 성능은 R^2 score 평가지표에 따라 채점) import pandas as pd x_train=pd.read_csv('/content/drive/MyDrive/Colab Notebooks/빅분기 실기/프리렉/data/bike_x_train.csv',encoding='cp949') y_train=pd.read_csv('/content/drive/MyDriv..
문제1. 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지 가늠하는 숫자는 무엇인가요? 답: 분산 문제2. 인공신경망의 출력값이 원하는 결과와 다를 경우, 가중치 갱신을 통해 오차를 최소화 시키도록 반복수행하여 신경망을 학습시키는 알고리즘이 무엇인가요 ? 답: 역전파 알고리즘 문제3. 차원축소와 군집화를 동시에 수행하며, 고차원으로 표현된 데이터를 저차원으로 변환하여 보는 비지도학습 기반 클러스터링 기법은 무엇인가요 ? 답: 자기 조직화 지도(self organization map) - SOM 문제4. 많은 데이터를 그림을 이용하여 집합의 범위와 중앙값을 빠르게 확인할 수 있으며, 또한 통계적으로 이상값이 있는지 빠르게 확인이 가능한 시각화 기법은 무엇인가요 ? 답: 박스플롯 문제5. 학습 데이터에..