일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 행별속성합계
- 리스트
- 셋
- 파이썬딕셔너리
- 빅데이터분석기사
- 공빅데기관매칭
- 파이썬셋
- 컨테이너
- 빅분기
- 워드클라우드
- 공빅데
- 태블로
- 파이썬튜플
- csv병합
- 백준1920
- 실기
- konlpy
- 빅분기실기
- 파이썬입출력
- 튜플
- set시간복잡도
- 백준 2164
- 딕셔너리
- 예측모델링
- 파이썬
- dataq
- 파이썬AHP
- 공공빅데이터청년인턴
- 2회기출
- 작업형2
- Today
- Total
목록전체 글 (53)
Data Science
조건에 따라 계산된 컬럼 생성하기¶ 목적 : 설치가능면적 ~ 공원 면적 * X 컬럼을 새로 생성하려함¶ In [1]: # 필요한 라이브러리, 모듈 import import pandas as pd In [2]: # 불러와 데이터프레임으로 변환 file_name = '인천도시공원정보표준데이터_2.csv' df = pd.read_csv(file_name) df.head(2) Out[2]: 관리번호 공원명 공원구분 소재지도로명주소 소재지지번주소 위도 경도 공원면적 공원보유시설(운동시설) 공원보유시설(유희시설) 공원보유시설(편익시설) 공원보유시설(교양시설) 공원보유시설(기타시설) 지정고시일 관리기관명 전화번호 데이터기준일자 제공기관코드 제공기관명 0 28170-00084 도담어린이공원 어린이공원 N..
지금은 공공데이터를 기반으로 데이터분석 프로젝트를 하고 있다. 첫주는 기획단계로 시작해서 둘째주는 분석, 셋째 주는 마무리 및 발표로 진행된다. 조별 프로젝트이기 때문에 서로 안 맞는조 걸리면 어쩔까 싶었는데 팀원 모두가 열심히 해주고 있다. 회의는 코로나 때문에 zoom 으로 진행됐고, 일부 원하는 날에 프로젝트룸을 이용 할 수 있게 하고 있다. 기획에 있어 주제를 선정함에 있어서 팀원들의 생각이 다양했고, 데이터가 없어 하고 싶어 못하는 것도 많았다. 아무래도 교육 들은 것을 기반으로 프로젝트를 하다보니 R, Python, Q-gis 를 활용하여 공공적인(?) 입지선정 최적화하는 프로젝트를 진행중이다. 역할 배정에서 분석쪽을 맡았는데 아직 부족한 점이 많아서 계속 공부하면서 하고 있다. 역시 공부는 ..
공빅데는 사전교육 -> 교육 -> 프로젝트 -> 현장배치 순으로 진행된다. 교육은 일부를 제외하고 7월에 마무리가 됐다. 먼저 교육후기 크게 R, Python, SQL, Q-gis 를 배웠다. 내용은 기초적인 사용법, 문법, 프로젝트 기획방법을 주로 다루고 추가로 파이썬 크롤링, 통계적인 부분까지 배운다. 단, 인공지능, 기계학습은 프로젝트가 끝나고 나서 24시간의 시수가 진행되는 것으로 계획에 잡혀있다. 사실 Q-gis 와 Python 크롤링을 제외하고는 대부분 알고 있던 내용이었기 때문에 아쉬웠다. 전공자나 배워본 사람에게는 약간 아쉬운 감이 있지 않을까 싶다. 전공자들은 교육과정을 진행하면서, 다른 스터디를 꾸리거나 개인 공부를 해도 좋을 것 같다. (조금 힘들겠지만) 하지만 이 프로그램의 주된 목..