<aside>
[PDF 자료 확인]
챌린지머신러닝_스킬업_-_임영재_튜터.pdf
[녹화본 확인]
Video Conferencing, Web Conferencing, Webinars, Screen Sharing
</aside>
<aside>
🔍
챌린지 4회차
[수업 목표]
- 스마트 팩토리 데이터(삼성 스마트팩토리)를 활용한 데이터 분석
[목차]
- 다중공선성 처리 방법
- 다중공선성이란?
- VIF기반 변수제거
- 높은 상관관계를 가진 변수 제거
- PCA 분석
- 정규화 회귀
- 결측치처리
- 결측치 제거
- 평균,중앙값, 최빈값 대체
- KNN Imputation (K-최근접 이웃 대체)
- 다중 대체법 (Iterative Imputation, MICE)
- 이상치처리
</aside>
<aside>
💡 모든 토글을 열고 닫는 단축키
Windows : Ctrl
+ alt
+ t
Mac : ⌘
+ ⌥
+ t
</aside>
01. 다중공선성 처리 방법
- 다중공선성이란?
- VIF기반 변수제거
- 높은 상관관계를 가진 변수 제거
- PCA 분석
- 정규화 회귀
02. 결측치 처리
- 결측치 제거
- 평균,중앙값, 최빈값 대체
- KNN Imputation (K-최근접 이웃 대체)
- 다중 대체법 (Iterative Imputation, MICE)
03. 이상치 처리
- 이상치 제거
- 이상치를 경계값으로 대체
- 로그 변환, Box-Cox 변환
- RobustScaling