「クラウド に上げる前にローカルで試したい」「 数百 MB を で叩きたい」── 軽量分析 DB 3 種の使い分け。
3 ツール比較
| ツール | 向く用途 | 強み | 弱み |
|---|---|---|---|
| DuckDB | OLAP 分析 | Parquet 直読み、高速集計 | OLTP 不向き |
| SQLite | アプリ組込み・軽量永続化 | ユビキタス、ゼロ依存 | OLAP は遅い |
| Postgres | 本格 RDBMS をローカルで | フル機能、互換性◎ | 起動・セットアップ重 |
DuckDB の威力
DuckDB で Parquet を直接 SQL
Python
import duckdb# Parquet を SQL で集計(DataFrame 経由不要)result = duckdb.sql(""" SELECT date, SUM(amount) as total FROM 'orders/*.parquet' WHERE date >= '2026-01-01' GROUP BY date""").df() # → pandas DataFramePandas / Polars との連携
DuckDB は pandas/polars と双方向に変換可。重い集計は DuckDB、可視化は pandas のような使い分けがベスト。
ふくふくの進め方
ローカル分析の標準スタックとして DuckDB + Polars + Jupyter を推奨。プロトタイプ段階の高速化に効きます。
次回予告
EP.04 はシェル作業を 3 倍速にする道具:fd / fzf / ripgrep / zoxide / atuin。
この記事の感想を教えてください
あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。