ふくふくHukuhuku Inc.
EP.07Viz 10分公開: 2026-05-10

多変量を伝える4種:散布図・散布図行列・相関ヒートマップ・パラレル座標

3軸以上のデータを1枚で見せるグラフ群。アヤメ分類で有名な散布図行列、相関一望のヒートマップ、業界別比較のパラレル座標。データサイエンス現場の標準。

#可視化#多変量#相関#scatter
CO📔 Google Colab で開く(上から順にセルを実行)
シェア

「変数が4個以上」「相関を網羅的に見たい」── データサイエンス現場の入口で必ず使うグラフ群。

対応マトリクス
グラフmatplotlibExcel
散布図
散布図行列⚠️ 自作
相関ヒートマップ⚠️✅(条件付き書式)
パラレル座標

1. 散布図

用途:2変数の関係性。年齢 × 収入、広告費 × 売上、気温 × 来店数。 強み:相関・・クラスターが一目。 弱み:点が重なると密度が分からない(ヘックスビンで対処)。

Iris の sepal length × petal length 散布図、3種で色分け
散布図:2変数の関係。3種が綺麗に分かれることが分かる

2. 散布図行列(pair plot)

用途:4〜10 個の変数の全ペア相関を一望。アヤメの分類でデータサイエンス入門の定番。 強み:変数間の関係が網羅的。クラスタリングや特徴量選択の入口。 弱み:変数数が増えると爆発(10変数で 100 セル)。

Iris 4変数 × 4変数の散布図行列。対角は分布
散布図行列:全ペアの関係を一望。対角は1変数の分布

3. 相関ヒートマップ

用途:相関係数の行列を色で。赤=正の相関、青=負の相関。多変量の前処理で必須。 強み:50変数規模でも一望可。 弱み:相関係数だけでは「関係の形」までは分からない(散布図と併用)。

Iris 4変数の相関ヒートマップ、赤〜青のグラデーション
相関ヒートマップ:変数間の相関を色で。多変量の前処理で必須

4. パラレル座標プロット

用途:複数の縦軸を並べて、各データを「折れ線」として描く。スポーツ選手のスペック、製品のスペック比較、業界別 比較。 強み:個別データの傾向が見える、クラスタリングの可視化。 弱み:データ数が多すぎると毛玉。色分けと透明度設定が肝。

Iris のパラレル座標プロット。4縦軸を並べた折れ線
パラレル座標:複数次元のデータを折れ線の束として
アヤメで散布図行列 + 相関ヒートマップ
Python
import seaborn as snsimport matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
# 散布図行列sns.pairplot(iris, hue="species", height=2.2)plt.show()
# 相関ヒートマップplt.figure(figsize=(7, 5))sns.heatmap(iris.drop(columns=["species"]).corr(), annot=True, cmap="RdBu_r", center=0, vmin=-1, vmax=1)plt.title("Iris features correlation")plt.show()

次回予告

EP.08 は進捗・KPI系:KPIカード・スコアカード・ゲージ・バーンアップ。経営ダッシュボードの主役たち。

シェア

この記事の感想を教えてください

あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。

シリーズの外も探す:

まずは、現状を聞かせてください。

要件が固まっていなくて大丈夫です。現状診断と方針提案までを無料でお手伝いします。

無料相談フォームへ hello [at] hukuhuku [dot] co [dot] jp