9. Feature Engieneering (특성공학, 변수파생)
✔ 기존 수치 데이터를 변형하여 새로운 의미를 가진 변수를 생성연령대 생성 → 나이를 10대, 20대, 30대 등 범주형 데이터로 변환누적합 → 판매량을 날짜별로 누적하여 누적 매출 생성평균 대비 차이 → 개별 값이 평균보다 얼마나 높은지 계산로그 변환 → 데이터의 분포가 치우친 경우 로그 스케일로 변환하여 정규화import pandas as pdimport numpy as np# 샘플 데이터 생성df = pd.DataFrame({ '이름': ['철수', '영희', '민수', '지수'], '나이': [23, 35, 45, 52], '월급': [250, 400, 600, 700]})# 연령대 변수 생성df['연령대'] = pd.cut(df['나이'], bins=[0, 30, 40, 50, ..