11. 시각화
경고창제거, 한글폰트 사용import warnings# 경고창 제거warnings.filterwarnings('ignore')# 한글 글꼴 설정rc('font', family='Malgun Gothic') Matplotlibimport matplotlib.pyplot as pltfrom matplotlib import rcimport warnings# 경고창 제거warnings.filterwarnings('ignore')# 한글 글꼴 설정rc('font', family='Malgun Gothic')# 데이터 준비x = [1, 2, 3, 4, 5]y = [10, 20, 30, 40, 50]# 그래프 그리기plt.plot(x, y, label="한글 데이터", color='blue', marker='o')p..
9. Feature Engieneering (특성공학, 변수파생)
✔ 기존 수치 데이터를 변형하여 새로운 의미를 가진 변수를 생성연령대 생성 → 나이를 10대, 20대, 30대 등 범주형 데이터로 변환누적합 → 판매량을 날짜별로 누적하여 누적 매출 생성평균 대비 차이 → 개별 값이 평균보다 얼마나 높은지 계산로그 변환 → 데이터의 분포가 치우친 경우 로그 스케일로 변환하여 정규화import pandas as pdimport numpy as np# 샘플 데이터 생성df = pd.DataFrame({ '이름': ['철수', '영희', '민수', '지수'], '나이': [23, 35, 45, 52], '월급': [250, 400, 600, 700]})# 연령대 변수 생성df['연령대'] = pd.cut(df['나이'], bins=[0, 30, 40, 50, ..