SERIES

異常検知ハンドブック：3σから機械学習まで

外れ値検知の古典手法から Isolation Forest・LOF・時系列分解・オートエンコーダまで。不正検知・SRE・故障予測の現場で本当に使える手法を1つずつ。

対象読者: データサイエンティスト / SRE / リスク管理

全 10 記事

異常検知の基本：3σ・四分位法と「正常」の定義

「outlier」は数学では「正常から外れた値」だが、ビジネスでは「対処すべき値」に変換しないと意味がない。本シリーズの開幕として、異常検知の3つの問い ── 何を異常とみなすか・どう検出するか・誰が対処するか ── を整理する。

「3.5 以上を異常」は経験則。業界・データ特性に応じた閾値の決め方と、A/B テストでの検証。

ラベルなしで「普段と違う点」を見つける機械学習の定番。Isolation Forest（孤立してる点ほど浅く隔離される）と LOF（局所密度比）。

「金曜は普段からアクセスが多い」「12 月は売上が伸びる」── 季節性を考慮した異常検知。STL 分解で trend/seasonal/residual に分解し、residual で異常を見つける。

「CPU 使用率は普通、メモリも普通、ディスク IO も普通、でも組み合わせが異常」── 1 次元では見えない異常を見つける。

深層学習で「正常データを圧縮 → 復元」を学習。異常データは復元できず、誤差が大きくなる。画像・時系列・ログ全般に応用可。

バッチ集計後に「昨日の異常」を発見しても遅い。Kafka/Kinesis 上でリアルタイム検知するアーキテクチャ。

ラベルが揃った教師あり評価（Precision/Recall/F1）と、ラベルがない教師なし評価（クラスタの分離度・Silhouette）。両方の使い分け。

クレジットカード不正利用、機械の故障予測、SRE のインシデント検知 ── 異常検知の典型的な活用事例。それぞれの精度要求と運用設計。

「精度が出るモデル」より「運用できるパイプライン」。データドリフト・モデル劣化・Feedback Loop の設計まで。

要件が固まっていなくて大丈夫です。現状診断と方針提案までを無料でお手伝いします。

無料相談フォームへ hello [at] hukuhuku [dot] co [dot] jp