개요
- 금융 도메인에서 사용하는 주식 데이터의 전처리 및 변환 과정을 통해 의미 있는 인사이트를 도출하고, 이를 시각화하여 의사 결정권자들이 쉽게 사용할 수 있도록 하는 데 목적이 있습니다.
배경
- 금융 관련 의사 결정자가 (금융 기관, 기업, 개인 사용자 등) 실제로 사용하는 데이터를 분석하여 금융 시장의 트랜드 파악, 투자 전략 수립, 리스크 관리 등 다양한 목적으로 사용될 수 있습니다. 이 프로젝트는 S&P 500 주식 데이터 분석을 통해 데이터 기반의 의사결정을 이해하고 활용하고자 합니다.
주제
- 분석 주제는 "금융 데이터의 전처리 및 시각화를 통한 주식 투자 전략 세우기"입니다. 구체적으로, 주식 시장 데이터를 활용하여 주식 시장의 트랜드를 파악하고, 이를 통해 투자 전략을 수립하는 것을 목표로 합니다.
설명
- 데이터 수집: S&P 500 stock data를 사용합니다.
- 데이터 전처리: 데이터 결측치 처리, 이상치 제거, 데이터 정규화 등의 전처리 과정을 수행합니다.
- 결측치 처리: 결측치가 있는 행 또는 열을 제거하거나 적절한 값으로 대체합니다.
- 이상치 제거: 통계적 방법 또는 도메인 지식을 활용하여 이상치를 식별하고 제거합니다.
- 데이터 정규화: 데이터의 분포를 일정하게 맞추어 분석 결과의 일관성을 높입니다.
- 데이터 시각화: 전처리된 데이터를 시각화하여 금융 시장의 동향을 파악합니다. 이를 위해 다양한 시각화 기법(예: 시계열 차트, 히트맵, 분포도 등)을 사용합니다.
- 시계열 차트: 시간에 따른 주가 변동을 시각화하여 시장의 장기적인 동향을 파악합니다.
- 히트맵: 다양한 주식의 상관관계를 시각화하여 포트폴리오의 다변화를 분석합니다.
- 분포도: 주가의 분포를 시각화하여 투자 위험을 평가합니다.