머신러닝 피쳐스케일링의 4가지 방식
1. MinMax Scaler
from sklearn.preprocessing import MinMaxScaler
MinMaxScaler().fit_transform(arr)
최소값이 0, 최대값이 1이 되도록 조정한다
이상수치가 있을 시 좁은 구간에 데이터가 몰릴 수 있음 제거필요
2. Standard Scaler
from sklearn.preprocessing import StandardScaler
StandardScaler().fit_transform(arr2)
평균 0, 표준편차 1이 되도록 모든 값을 조정하여 정규분포를 따르게한다
3.MaxAbs Scaler
from sklearn.preprocessing import MaxAbsScaler
MaxAbsScaler().fit_transform(arr3)
0을 기준으로 절대값이 최대인값을 1로 설정하고 나머지 값들은 기준에 맞추어 0~1 사이로 변환 처리
4. Robust Scaler
from sklearn.preprocessing import RobustScaler
RobustScaler().fit_transform(arr4)
중앙값을 0, 사분위수 기준 전체 데이터의 50%가 중앙에 밀집되도록 변환
중앙에 흩어진 범위가 1이 되도록 조정한다
'Python > 머신러닝' 카테고리의 다른 글
[머신러닝] 머신러닝 분류 알고리즘 정리 (1) | 2024.08.30 |
---|---|
[XAI] XGBoost 분류 모델 시각화 (6) | 2024.08.28 |
머신러닝 데이터 교차검증 python (0) | 2024.03.05 |