ふくふくHukuhuku Inc.
FIELD NOTES

実装の現場から、
詰まりどころを書き残す。

ふくふくのエンジニアが、現場で詰まったポイントを連載形式でコラム化。技術選定の判断基準まで、生のまま公開しています。

NOTE各記事の「想定される実行結果(例示)」セクションは、ふくふくの実装イメージを伝えるための説明用サンプルです。実プロジェクトの数値・固有情報は守秘契約上含みません。
読みたい記事が決まらない時に。クッキー不使用、既読履歴はお使いのブラウザのみに保存されます。

最新記事

AlgorithmsEP.01

なぜ現代アルゴリズムを学ぶか:教科書には載っていない実システムの心臓

Pinecone・BigQuery・Notion・Bitcoin。これらの中で動いているのは、教科書のソート・探索ではない。確率的・近似・分散アルゴリズムが現代システムを支える。本シリーズの導入。

8分2026-05-11
AlgorithmsEP.02

HNSW:Pinecone・Qdrant・pgvector を 100 倍速くする近似最近傍探索

「あるベクトルに近い 10 個」を 100 万件から 10ms で見つける。Pinecone・Qdrant・pgvector・OpenSearch の中で動いているアルゴリズムを、Python と hnswlib で実装・ベンチ。

10分2026-05-11
AlgorithmsEP.03

HyperLogLog:BigQuery が 1 兆件のユニーク数を 16KB で数えるアルゴリズム

COUNT(DISTINCT) は本来メモリ大食い、1 兆件のユニーク数なら数百 GB 必要。これを 16KB・1% 誤差で実現するのが HyperLogLog。Python で実装し、実機で 1.01% 誤差を確認。

10分2026-05-11
AlgorithmsEP.04

Count-Min Sketch:Twitter のトレンドを支える頻度推定アルゴリズム

「過去 1 時間で最も投稿された単語 TOP 10」をリアルタイムに集計するには? 頻度上位を確率的に推定する Count-Min Sketch を Python で実装、Twitter / Cloudflare の中身。

9分2026-05-11
AlgorithmsEP.05

Bloom Filter:Cloudflare のセキュリティと Bitcoin SPV を支える確率的フィルタ

「この URL は犯罪サイトか?」を 117KB のメモリで 99% 正答。Cloudflare・Bitcoin・Chrome の Safe Browsing で動く Bloom Filter を Python で実装。

9分2026-05-11
AlgorithmsEP.06

MinHash + LSH:1 億文書から似たペアを高速発見する確率的アルゴリズム

「剽窃検査」「重複コンテンツ検出」「商品レコメンド」。1 億件の文書から似たペアを O(n) で見つける MinHash + LSH を Python で実装、Google・Spotify の中身。

10分2026-05-11
AlgorithmsEP.07

CRDT:Notion・Figma・Linear のリアルタイム同時編集を支える分散データ構造

「複数人が同じドキュメントを同時に編集してもコンフリクトしない」を数学的に保証する CRDT を Python で実装。G-Counter・LWW-Set・RGA の仕組み。

10分2026-05-11
AlgorithmsEP.08

Raft:etcd・Consul・TiDB の中核を支える分散合意アルゴリズム

「複数のサーバが障害を起こしても、全員が同じ値で合意する」分散合意 Raft を Python で実装。Paxos より理解しやすく、Kubernetes / TiDB / CockroachDB が採用。

11分2026-05-11
AlgorithmsEP.09

Merkle Tree:Bitcoin・Git・IPFS が使う改ざん検出のハッシュツリー

「巨大データのどこか 1 bit が変わったら、ハッシュ 1 つで検出できる」Merkle Tree を Python で実装。Bitcoin の SPV、Git のオブジェクト、IPFS の中身。

9分2026-05-11

まずは、現状を聞かせてください。

要件が固まっていなくて大丈夫です。現状診断と方針提案までを無料でお手伝いします。

無料相談フォームへ hello [at] hukuhuku [dot] co [dot] jp