EP.11 では「PR レビューを LLM-first に移行する」方針を述べました。本 EP ではその具体ツール CodeRabbit / Greptile / Cursor Bugbot / GitHub Copilot Code Review / Claude Action 自前 を、機能・料金・S/N 比で比較します。
1. 5 ツールのざっくり比較表
| ツール | 種類 | 強み | 料金目安 | 向き |
|---|---|---|---|---|
| CodeRabbit | SaaS | 詳細レビュー + サマリー、日本語対応 | OSS 無料 / 月 $12〜/シート | 汎用、初期導入 |
| Greptile | SaaS | コードベース全体インデックス、影響分析 | 月 $30〜/シート | 大規模・密結合 |
| Cursor Bugbot | SaaS (Cursor 付属) | バグ特化、S/N 比高め | Cursor Pro $20/月 に含む | Cursor ユーザー |
| GitHub Copilot Code Review | SaaS (GitHub 純正) | GitHub ネイティブ統合、設定最少 | Copilot Enterprise $39/月 | GitHub Enterprise 既契約 |
| Claude Action 自前 | DIY (GitHub Actions) | 完全カスタマイズ、社内規約埋込 | API 従量 (1 PR 数円〜数十円) | 中規模以上、最適化重視 |
2. CodeRabbit (汎用 SaaS の本命)
- 詳細なインライン指摘 + PR サマリー (要約・チェンジログ) を自動生成
- 日本語コメント対応 が最も自然 (国内 SaaS 並み)
- OSS リポジトリは完全無料、個人利用も無料枠あり
- `.coderabbit.yaml` で設定 (除外パス・言語別ルール・ペルソナ等)
- 学習機能: 過去のフィードバックを学習して指摘精度を上げる
「LLM レビュー初導入」の最短ルートは CodeRabbit。OSS 無料枠で 1 ヶ月運用 → 効果実感したら有料プランへ → S/N 比 70% 超えたら全社展開、の流れが鉄板。
3. Greptile (アーキテクチャ影響分析)
- コードベース全体を事前にインデックス、依存関係グラフを内部に持つ
- 「この変更がリポジトリ全体にどう波及するか」 をレビュー時に評価
- PR diff だけしか見ない他ツールに無い指摘
- 密結合・大規模 (10万行以上) コードベース で真価を発揮
- 料金やや高め、小規模リポジトリではオーバーキル
4. Cursor Bugbot (バグ検出特化)
- Cursor (AI コードエディタ) の機能として提供
- 信頼度が高い指摘だけを返す方針 (S/N 比重視)
- 「指摘の数が少ない代わりに、指摘されたら本物」
- Cursor を既に使っているチームなら追加コスト最小
- Cursor を使わない組織には敷居が高い (エディタ強制)
5. GitHub Copilot Code Review (純正)
- GitHub の Pull Request UI に直接統合
- 設定最少、有効化チェックボックスのみ
- Copilot Enterprise / Business プランに含まれる (個別課金不要)
- 他 SaaS より指摘がやや汎用的・浅い傾向
- 「とりあえず始める」 には最も摩擦が少ない
6. 自前実装 (Claude Action)
プロンプトを完全カスタマイズしたい場合の選択肢。実装の最小例は EP.11 に YAML サンプルあり。月 100 PR を超えると、API 従量制 (1 PR 数円〜数十円) のほうが SaaS 月額より安くなる損益分岐点を超えます。
| 観点 | SaaS | 自前 (Claude Action) |
|---|---|---|
| 初期コスト | ほぼゼロ (アカウント作成のみ) | プロンプト設計 + GHA セットアップ 1〜2 日 |
| 運用コスト | シート数 × 月額 | API 従量 + GHA 実行時間 |
| カスタマイズ性 | 設定ファイルの範囲内 | 完全自由 |
| 社内規約反映 | プロンプト固定 | プロンプトに埋込み可 |
| データ社外送信 | SaaS 経由 (要規約確認) | Claude API (Anthropic 経由) |
| 社内 LLM 切替 | 不可 | 可能 (Bedrock / Vertex AI 等) |
7. 組織規模別の推奨
| 組織規模 | 推奨 | 理由 |
|---|---|---|
| 個人 / OSS | CodeRabbit | OSS 無料、設定簡単 |
| スタートアップ (5-30 人) | CodeRabbit + Cursor (Bugbot) | Cursor 自体で生産性上、Bugbot 副次効果 |
| 中規模 (30-300 人) | CodeRabbit + Greptile (補助) | メインは汎用、アーキテクチャ重視部分のみ Greptile |
| 大規模 (300+ 人) | 自前 Claude Action + 社内 LLM | 規約反映・データ統制が重要 |
| 金融・医療等高規制業界 | 自前 (社内 LLM ホスト) | diff の社外送信が許容されない |
8. 効果測定の指標
- 指摘 S/N 比: 役立った件数 ÷ 全指摘件数 (週次)
- 初回レビュー応答時間: 人間レビューと比較した短縮率
- Critical 指摘の検出件数: ツールが本物のバグを見つけた数
- 人間レビュー削減率: LLM 完結 PR の比率
- 1 PR あたりの API/SaaS コスト: 経営報告用
これらを Engineering Dashboard (EP.10) に載せておくと、ツール乗換えの判断材料になります。
9. 関連記事
- EP.11 PR レビューこそ LLM に置き換えるべきだ — 移行の基本方針
- EP.02 GitHub API で PR 活動を集計 — レビュー応答時間の測定
- Claude Code 受託開発記 — Claude を開発業務全般に
本 EP は読者リアクションに応じて、「各ツールの実機ベンチマーク」 「プロンプト最適化の deep dive」 「社内 LLM ホストの実装ガイド」 などを追加していきます。
この記事の感想を教えてください
あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。