Skip List ってどういう仕組み？

**ソート済み連結リストに「ショートカットの層」を確率的に追加** したデータ構造。上の層ほど要素が少なく、下の層ほど詳細。検索は上の層から「まだ目的より小さい間進む、超えたら下の層へ」を繰り返す。**1989 年 William Pugh が発明**。

なぜ「確率的」？

**各要素の高さ (層数) を確率 p (典型 0.5) でランダムに決定する**。決定論的なバランス木 (赤黒木 / AVL) と違い、**回転 (rotation) なし** で平均 O(log n) を達成。実装が圧倒的に簡単。

Skip List vs B-Tree vs RB-Tree

**実装難易度**: Skip List >> B-Tree > RB-Tree。**並行処理**: Skip List は Lock-Free 化が簡単 (Java の ConcurrentSkipListMap)。**メモリ局所性**: B-Tree が最良 (Disk I/O 効率)。**だからこそ Redis (in-memory) は Skip List、PostgreSQL (on-disk) は B-Tree**。

Redis ZSET の中身は？

**Skip List + Hash Table の二段構え**。Skip List で「score 順の範囲取得」、Hash Table で「member → score の O(1) 検索」。**ZRANGE / ZRANGEBYSCORE / ZRANK** がいずれも O(log n) で動くのはこのため。

本番で使われている例は？

**Redis ZSET (Sorted Set)**: ランキング / 時系列イベント。**LevelDB / RocksDB**: MemTable の実装。**Apache Cassandra**: SSTable のインデックス。**Java ConcurrentSkipListMap**: スレッドセーフな TreeMap 代替。

**期待値で全操作 O(log n)**: 検索・挿入・削除・順位取得・範囲取得。**最悪 O(n)** だが確率的に発生しない。空間計算量 O(n) (高さの期待値が 1/(1-p) ≈ 2)。**実用的にはバランス木と遜色ない**。

Skip List：Redis の Sorted Set を支える確率的なソート済みデータ構造（Algorithms EP.12）

Redis のリーダーボード「ゲームのランキング上位 100」「フォロワー数順のユーザリスト」「最新ツイート 50 件」 ── これらすべて Sorted Set (ZSET) で実装され、その中身が Skip List。連結リストにショートカット層を確率的に追加するだけで O(log n) を実現する、エレガントなデータ構造。

1. これで何が動いているか

Redis Sorted Set (ZSET): ランキング / 時系列
LevelDB / RocksDB: MemTable の中核
Apache Cassandra: SSTable インデックス
Java ConcurrentSkipListMap: スレッドセーフな TreeMap
etcd: メモリ内インデックス

2. 仕組みのざっくり

最下層 (level 0): ソート済みの連結リスト
上の層: 各要素を確率 p (典型 0.5) で持ち上げた要素のリスト
検索: 最上層から開始、「次が目的より小さければ進む、大きければ下の層へ」
挿入: 検索しながら経路を記録 → ランダムな高さで全層に挿入
期待計算量: 平均高さ 1/(1-p) = 2、検索 O(log n)

3. Python 実装 (動作確認済)

純粋 Python の Skip List

Python

import random
class SkipNode:    def __init__(self, key, level):        self.key = key        self.forward = [None] * (level + 1)
class SkipList:    def __init__(self, max_level=16, p=0.5):        self.max_level = max_level        self.p = p        self.header = SkipNode(None, max_level)        self.level = 0
    def random_level(self):        '''高さを確率的に決定 (期待値 1/(1-p))'''        lvl = 0        while random.random() < self.p and lvl < self.max_level:            lvl += 1        return lvl
    def insert(self, key):        update = [None] * (self.max_level + 1)        cur = self.header        # 検索しながら経路 (update) を記録        for i in range(self.level, -1, -1):            while cur.forward[i] and cur.forward[i].key < key:                cur = cur.forward[i]            update[i] = cur
        lvl = self.random_level()        if lvl > self.level:            for i in range(self.level + 1, lvl + 1):                update[i] = self.header            self.level = lvl
        new = SkipNode(key, lvl)        for i in range(lvl + 1):            new.forward[i] = update[i].forward[i]            update[i].forward[i] = new
    def search(self, key):        cur = self.header        for i in range(self.level, -1, -1):            while cur.forward[i] and cur.forward[i].key < key:                cur = cur.forward[i]        cur = cur.forward[0]        return cur is not None and cur.key == key
    def display(self):        '''各層を可視化'''        for i in range(self.level, -1, -1):            keys = []            cur = self.header.forward[i]            while cur:                keys.append(cur.key)                cur = cur.forward[i]            print(f'Level {i}: {keys}')
# 動作確認random.seed(0)sl = SkipList()for x in [3, 6, 7, 9, 12, 19, 17, 26, 21, 25]:    sl.insert(x)
sl.display()print(f'\n19 がある? {sl.search(19)}')print(f'100 がある? {sl.search(100)}')
# 実機実行例:# Level 0: [3, 6, 7, 9, 12, 17, 19, 21, 25, 26]# Level 1: [3, 6, 12, 19, 25]# ...# 19 がある? True, 100 がある? False

4. Redis ZSET との関係

redis-py で Skip List ベースの Sorted Set

Python

# pip install redisimport redis
r = redis.Redis(host='localhost', port=6379, decode_responses=True)
# ZADD で score 付きでメンバー追加r.zadd('leaderboard', {    'alice': 95, 'bob': 80, 'carol': 100, 'dave': 75, 'eve': 88})
# 上位 3 件 (内部的には Skip List で O(log n))top3 = r.zrevrange('leaderboard', 0, 2, withscores=True)print(f'TOP 3: {top3}')
# alice の順位 (内部的には Skip List で O(log n))rank = r.zrevrank('leaderboard', 'alice')print(f'alice の順位: {rank + 1}')
# score 80-95 の範囲mid = r.zrangebyscore('leaderboard', 80, 95)print(f'80-95 の範囲: {mid}')

5. 計算量比較

操作	Skip List	Red-Black Tree	Hash Table
検索	O(log n)	O(log n)	O(1)
挿入	O(log n)	O(log n)	O(1)
削除	O(log n)	O(log n)	O(1)
順位取得	O(log n)	O(log n)	不可
範囲取得	O(log n + k)	O(log n + k)	O(n)
実装難易度	易	難 (回転)	中

6. メリットとデメリット

メリット: 実装が圧倒的に簡単 (回転なし)
メリット: Lock-Free / 並列化が容易 (各層を独立に操作可)
メリット: 「順位」「範囲」操作が高速
デメリット: ランダム性に依存 (最悪 O(n)、ただし確率的に稀)
デメリット: メモリ局所性が悪い (B-Tree より遅い場合あり)

7. 次の話

EP.13 では LSM Tree (Log-Structured Merge Tree) を扱います。Cassandra / RocksDB / BigTable / DynamoDB が使う、書込み性能を最大化するストレージエンジンの仕組み。

この記事の感想を教えてください

あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、ふくふくが 実際に内容を拡充したり続編記事を公開 します。送信したリアクションはお使いのブラウザに記録され、再カウントされません。

免責事項

本記事は執筆時点の情報および実装例として公開しているものであり、内容の正確性・完全性・最新性を保証するものではありません。各データソース・API・SaaS の仕様・利用規約・料金は予告なく変更される場合があります。
コード・コマンド・手順を実装や本番運用に流用する際は、必ず最新の公式ドキュメントおよび利用規約を確認のうえ、ご自身の責任で適切な検証・テストを行ってください。
本記事の情報を利用したことにより生じた損害（データ消失・サービス中断・契約違反・第三者からの請求等）について、合同会社ふくふくおよび執筆者は一切の責任を負いません。
本記事は技術・実装上の解説を目的としたものであり、法務・税務・コンプライアンス・経営上のアドバイスを構成するものではありません。実際の判断にあたっては、必要に応じて専門家にご相談ください。
記事中で紹介する第三者のサービス・製品・OSS・データ提供者については、各提供元の利用規約・ライセンス条件が優先されます。

Skip List：Redis の Sorted Set を支える確率的なソート済みデータ構造