Link
Recent Posts
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 공빅데
- 리스트
- 태블로
- 워드클라우드
- 파이썬AHP
- 공공빅데이터청년인턴
- 빅데이터분석기사
- 파이썬딕셔너리
- 실기
- 파이썬튜플
- 튜플
- set시간복잡도
- 공빅데기관매칭
- 파이썬셋
- 딕셔너리
- 파이썬
- 백준 2164
- 셋
- 빅분기
- dataq
- 파이썬입출력
- csv병합
- 예측모델링
- 백준1920
- 행별속성합계
- 2회기출
- konlpy
- 컨테이너
- 작업형2
- 빅분기실기
- Today
- Total
Data Science
[태블로] [DAY2] 행과 집계, 필드계산 본문
이론 영상 - <행과 집계>
'계산에 오류 있음' 오류는 행 수준과 집계 수준이 섞였을때 발생한다.
즉, 행 수준은 모두 다 더해져서 2만 퍼센트가 나온것이다.
계산된 필드를 만들어, 매출 2억이상 인곳을 색상을 표시해보자.
매출 > 2억 (X)
SUM(매출) > 2억 (O)
DAY2 - 스타벅스 메뉴 분석
1. 워드클라우드
칼로리가 높은 메뉴명을 분석해보자.
크기와 색상을 이용해 한눈에 볼수 있다!
2. 박스플롯
데이터 분포, 이상치를 동시에 보며 서로 다른 데이터 군을 쉽게 비교할 수 있다.
칼로리와 카페인이 둘 다 낮는것을 분석해보자
박스플롯으로 칼로리, 점 색상으로 카페인을 표현했습니다.
낮게 있을수록 칼로리가 적고, 색상이 파란색 일수록 카페인이 적어요!!
3. 계산된 필드 만들기
평균 카페인 함유량이 80mg 보다 높은 카테고리와 아닌 카테고리를 분류해서 보자.
+@ 추가 도전과제
매장명 별로 매장운영시간을 표현하고, 시도를 필터로 걸어 각 시도의 매장별운영시간을 확인하자.
DATEDIFF 함수에서 '날짜_부분'은 다음을 참고
필터는 '시도' 기준으로 하면된다!
또한, 단일 값(목록) 형태 필터로 바꾸자
하나씩 해결해 나가는 과정이 은근히 재밌다.
기능적 역량을 확실하게 쌓을 뿐만아니라, 어떤 상황에서 어떤 분석을 해야할지 잘 염두해둬야겠다.
수정 - 추가 도전과제 오답
매장 운영시간을 계산을할때,
'hour' 로 했을때는 분 단위차이가 계산되지 않은 한계점이 있습니다.
다음과 같이 환산하는 것이 더욱 정확합니다.
추가적으로 데이터들이 30분 단위로 되어있기 때문에, 0.500 처럼 뒤에 00은 필요가 없고 보기 싫습니다.
서식을 변경해보자
'데이터분석' 카테고리의 다른 글
[태블로] [DAY3] (2) 매개 변수, 대시보드 동작 (0) | 2023.06.08 |
---|---|
[태블로] [DAY3] (1) 매개 변수, 대시보드 동작 (0) | 2023.06.07 |
[태블로] [DAY1] 카테고리별 메뉴 분석 (0) | 2023.06.06 |
[태블로] [DAY0] 기초실습교육 (1) | 2023.06.06 |
SNS 텍스트 분석(konlpy) 및 워드클라우드 - 모양, 대용량 개선 (0) | 2021.11.08 |
Comments