데이터 사이언스
2021. 11. 24.
빅데이터 분석기사 실기 라이브러리 정리
빅데이터 분석기사 실기 키워드&라이브러리 정리 데이터 수집 DBMS ETL 스쿱, 스크래파이, 플럼, 스크라이브 데이터 정제 이상값 : describe 결측값 : isna 원핫인코딩: get_dummies 교체: replace, apply(lambda x: x) 데이터 모형 구축 교차검증 sklearn.model_selection Hold-out: train_test_split K-fold: KFold, cross_val_score LOOCV, LpOCV, 부트스트랩 GridSearchCV, RandomizedSearchCV 추출 방법 계통추출(systematic, shuffle=False) 층화추출(stratify) 데이터 정규화: sklearn.preprocessing MinMaxScaler Stan..