ふくふくHukuhuku Inc.
EP.12Prep 7分公開: 2026-05-10

数値特徴量のスケーリング:Standardize / MinMax / robust

「線形回帰には標準化、決定木には不要」は本当か? スケーリングが必要なモデル / 不要なモデルを判別する。

#スケーリング#標準化
シェア

スケーリング 前処理の基本だが、モデルによって必要性が違う。本記事では適用判断と手法選定を整理します。

4 つの手法

手法計算向くケース
StandardScaler(x - μ) / σ正規分布に近い、最も使われる
MinMaxScaler(x - min) / (max - min) → [0, 1]画像、NN 入力
RobustScaler(x - median) / IQR外れ値が多いとき
Log 変換log(x + 1)裾の重い分布(金額・滞在時間)

モデル別の必要性

モデルスケーリング理由
線形回帰 / ロジ回必須係数が特徴量スケールに依存
SVM必須距離計算が支配される
KNN必須距離計算
ニューラルネット必須勾配が爆発 / 消失
/ ランダムフォレスト / GBDT不要分割基準は順序のみ
XGBoost / LightGBM不要同上

ふくふくの進め方

前処理パイプラインの設計、特徴量エンジニアリングまで含めてご支援します。

次回予告

EP.13 は時系列データの前処理。リサンプリング・補間・差分系列。

シェア

この記事の感想を教えてください

あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。

シリーズの外も探す:

まずは、現状を聞かせてください。

要件が固まっていなくて大丈夫です。現状診断と方針提案までを無料でお手伝いします。

無料相談フォームへ hello [at] hukuhuku [dot] co [dot] jp