は開発活動の最重要データソース。Search API + API + GraphQL を組合せると PR 数・レビュー時間・コミット頻度・マージまでのリードタイム を時系列で取れます。

認証と PAT

PAT (Personal Access Token) を環境変数に

Bash

# Settings → Developer settings → Personal access tokens (classic) で作成# 必要なスコープ: repo (private含む), read:org
export GITHUB_TOKEN="ghp_xxxxxxxxxx"

PR を一括取得 (REST API)

ある期間の PR を全件取得

Python

import os, requestsfrom datetime import datetime, timezone, timedelta
TOKEN = os.environ["GITHUB_TOKEN"]HEADERS = {"Authorization": f"Bearer {TOKEN}", "X-GitHub-Api-Version": "2022-11-28"}
def fetch_prs(org: str, repo: str, since: datetime) -> list[dict]:    """指定リポの PR を since 以降で全件取得"""    prs = []    page = 1    while True:        r = requests.get(            f"https://api.github.com/repos/{org}/{repo}/pulls",            headers=HEADERS,            params={"state": "all", "per_page": 100, "page": page,                    "sort": "updated", "direction": "desc"},        )        r.raise_for_status()        data = r.json()        if not data:            break        # since より古いものが出てきたら終了        if datetime.fromisoformat(data[-1]["updated_at"].replace("Z","+00:00")) < since:            prs.extend([p for p in data                        if datetime.fromisoformat(p["updated_at"].replace("Z","+00:00")) >= since])            break        prs.extend(data)        page += 1    return prs
# 過去 30 日の PRsince = datetime.now(timezone.utc) - timedelta(days=30)prs = fetch_prs("hukuhuku-inc", "hukuhuku-co-jp", since)print(f"PR 件数: {len(prs)}")

GraphQL でレビュー時間を取得

GraphQL: 1 PR のレビュー履歴を取得

Python

query = """query($owner: String!, $repo: String!, $number: Int!) {  repository(owner: $owner, name: $repo) {    pullRequest(number: $number) {      title createdAt mergedAt      author { login }      reviews(first: 50) {        nodes {          author { login }          state           # APPROVED / CHANGES_REQUESTED / COMMENTED          submittedAt        }      }    }  }}"""
def get_pr_with_reviews(owner: str, repo: str, number: int):    r = requests.post(        "https://api.github.com/graphql",        headers=HEADERS,        json={"query": query, "variables": {"owner": owner, "repo": repo, "number": number}},    )    return r.json()["data"]["repository"]["pullRequest"]

主要メトリクスの計算

PR レベルのメトリクス算出

Python

import pandas as pd
def pr_metrics(pr: dict) -> dict:    """1 PR のメトリクスを算出"""    created = datetime.fromisoformat(pr["createdAt"].replace("Z", "+00:00"))    merged = pr.get("mergedAt") and datetime.fromisoformat(pr["mergedAt"].replace("Z","+00:00"))    reviews = pr.get("reviews", {}).get("nodes", [])    first_review = min(        (datetime.fromisoformat(r["submittedAt"].replace("Z","+00:00")) for r in reviews),        default=None,    )    return {        "title": pr["title"],        "author": pr["author"]["login"],        "lead_time_hours": (merged - created).total_seconds() / 3600 if merged else None,        "first_review_hours": (first_review - created).total_seconds() / 3600 if first_review else None,        "review_count": len(reviews),        "merged": merged is not None,    }
# 100 PR 分の集計df = pd.DataFrame([pr_metrics(p) for p in prs_with_reviews])print(df.describe())print("\n人別の平均リードタイム:")print(df.groupby("author")["lead_time_hours"].mean().sort_values())

レート制限と運用

GitHub API レート制限

REST: 5,000 req/h / トークン、GraphQL: 5,000 ポイント/h。組織規模が大きい場合は GitHub App で 15,000/h に引き上げ。ETag を使った If-None-Match キャッシュ + 必要な範囲だけ差分取得 で効率化。

ダッシュボードに載せる指標

週次 PR 作成数 / 人
マージまでのリードタイム (中央値・p95)
初回レビュー応答時間 (低いほど良い、目安 24h 以内)
レビューする側の負荷: 1 人あたり週レビュー数
マージなし PR 比率 (オープンのまま放置されている割合)
変更行数の分布 (大きすぎる PR が多くないか)

COLUMN

コラム：PR レビューこそ LLM に置き換えるべきだ

レビューの数字を集計していくと、必ず「レビュー応答時間 24 時間超え」「マージまでのリードタイム 5 日」のような遅延が見えてきます。原因は怠慢ではなく、人間レビューの構造的な問題です。

人間レビューの構造的なボトルネック

レビュアーの作業が止まる: 集中していたタスクを中断し、コンテキスト切替コスト（一般に 10-20 分）が乗る
依頼者が慎重になる: 「相手の時間を奪うから」と PR を大きく溜めがち → 1 PR あたり変更量が増えてレビューがさらに重くなる 悪循環
タイムゾーン差: グローバル開発で 1 往復 24 時間
レビュー品質のばらつき: 同じコードでも疲れた金曜の夕方と月曜朝で精度が違う
「指摘ゼロ」は怖くて言えない: 心理的に何か書かないと申し訳ない → 些末な指摘の応酬

LLM レビューの構造的な強み

応答が秒単位: PR 作成と同時にレビュー結果が出れば、依頼者は即座に修正開始
24/365 動く: 深夜でも休日でも止まらない
疲れない・ばらつかない: 同じプロンプトに対して同じ品質を返す
遠慮なく指摘できる: 心理的安全性の問題が消える（「書きやすい」と全員が感じる）
コーディング規約・セキュリティ・テスト網羅性のチェックは LLM の得意分野: 機械的な観点は人間より速く正確
「変更影響を全部読む」が現実になる: 人間は時間制約で全 diff を熟読しない、LLM はする

ふくふくの推奨：LLM-first レビュー

「LLM レビューを必須、人間レビューはオプション」に切り替えるのが現代的なフロー。CodeRabbit / Greptile / Cursor の Bugbot / GitHub Copilot Code Review などが SaaS で提供されています。あるいはを Action で自前実装も可能。

GitHub Actions: PR 作成時に Claude にレビューさせる最小例

YAML

name: Claude PR Reviewon:  pull_request:    types: [opened, synchronize]
jobs:  review:    runs-on: ubuntu-latest    steps:      - uses: actions/checkout@v4        with:          fetch-depth: 0      - name: Get diff        id: diff        run: |          git diff origin/${{ github.base_ref }}...HEAD > /tmp/pr.diff          echo "diff<<EOF" >> $GITHUB_OUTPUT          cat /tmp/pr.diff >> $GITHUB_OUTPUT          echo "EOF" >> $GITHUB_OUTPUT
      - name: Claude review        id: review        uses: anthropics/claude-action@v1        with:          api_key: ${{ secrets.ANTHROPIC_API_KEY }}          prompt: |            以下の PR diff をレビューしてください。
            ## チェック観点            1. ロジックの誤り・エッジケース            2. セキュリティ脆弱性 (XSS / SQLi / 認証漏れ)            3. テスト網羅性            4. コーディング規約 (.eslintrc / sqlfluff 等)            5. 命名・可読性            6. パフォーマンスへの懸念
            重要度を Critical / Major / Minor / Nit で分類し、            該当ファイル名・行番号を必ず添えること。            問題が無い箇所は言及しない (positive なノイズを増やさない)。
            ${{ steps.diff.outputs.diff }}
      - name: Post comment        uses: peter-evans/create-or-update-comment@v4        with:          issue-number: ${{ github.event.pull_request.number }}          body: |            ## 🤖 Claude review
            ${{ steps.review.outputs.response }}

LLM レビューだけにするリスクと対策

リスク	なぜ起きる	対策
設計判断のミス	LLM は「与えられた diff の中」しか見ない、組織の長期方針や歴史的経緯を知らない	重要な設計変更はアーキテクト 1 名のレビュー必須、それ以外は LLM だけで OK のような重要度分岐を CODEOWNERS で設定
ハルシネーション	存在しないAPI・関数名を「直すべき」と指摘してくる場合あり	信頼度ラベル（Critical/Major/Minor/Nit）と根拠提示をプロンプトで強制、依頼者が判断
「LLM が OK と言ったから安全」誤信	全テストパスもしてないのに緑判定	LLM レビュー + 必須テスト + 主要ファイル変更時は人間 1 名の三段構え
コード文化の継承断絶	新人が「人間に説明する練習」を経験せず育つ	月 1 のペアレビュー会で人間同士の議論機会を設計、新人教育に組込み
機密情報の外部送信	diff に PII やシークレットが含まれる	社内 LLM (Claude on Bedrock 等) + シークレットスキャンの pre-hook
LLM の偏り	特定言語・特定スタイルを過剰評価	プロンプトに社内コーディング規約を埋込み、LLM の素の傾向を上書き
レビューゼロ依存の心理リスク	「LLM が見てくれる」で集中が落ちる	自己レビュー（PR 作成前）の必須化 + LLM はその後の安全網

段階的な移行ロードマップ

1Step 1: LLM レビューを任意で導入。現状の人間レビューに追加する形。指摘の質を 1 ヶ月観察。
2Step 2: 「Minor / Nit は LLM 完結 OK、Major / Critical は人間も見る」 ルールに移行。応答時間が大きく改善するはず。
3Step 3: 「全 PR で LLM 必須、人間レビューは CODEOWNERS の重要パスのみ」 に移行。EP.02 の「初回レビュー応答時間」指標が 数時間 → 数分 に変わる。
4Step 4: DORA Lead Time の改善を測定 (EP.09)。経営層へ「PR レビュー LLM 化により Lead Time -40%」のような数字で報告。

ダッシュボードに「LLM レビュー被覆率」と「LLM レビューが指摘した Critical 件数」を追加 すれば、移行の効果と現状を一目で見られます。

このコラムを単独記事として深掘りしたものを EP.11「PR レビューこそ LLM に置き換えるべきだ」に書きました。SaaS / 自前 / 社内 LLM の3つの実装パターン比較、プロンプト設計のコツ、よくある反論への返答までまとめています。

次の話

EP.03 では / Anthropic API の usage を集計し、誰がどれだけを使ったかを可視化します。

この記事の感想を教えてください

あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、ふくふくが 実際に内容を拡充したり続編記事を公開 します。送信したリアクションはお使いのブラウザに記録され、再カウントされません。

免責事項

本記事は執筆時点の情報および実装例として公開しているものであり、内容の正確性・完全性・最新性を保証するものではありません。各データソース・API・SaaS の仕様・利用規約・料金は予告なく変更される場合があります。
コード・コマンド・手順を実装や本番運用に流用する際は、必ず最新の公式ドキュメントおよび利用規約を確認のうえ、ご自身の責任で適切な検証・テストを行ってください。
本記事の情報を利用したことにより生じた損害（データ消失・サービス中断・契約違反・第三者からの請求等）について、合同会社ふくふくおよび執筆者は一切の責任を負いません。
本記事は技術・実装上の解説を目的としたものであり、法務・税務・コンプライアンス・経営上のアドバイスを構成するものではありません。実際の判断にあたっては、必要に応じて専門家にご相談ください。
記事中で紹介する第三者のサービス・製品・OSS・データ提供者については、各提供元の利用規約・ライセンス条件が優先されます。

GitHub API で PR・レビュー・コミット活動を集計する

認証と PAT

PR を一括取得 (REST API)

GraphQL でレビュー時間を取得

主要メトリクスの計算

レート制限と運用

ダッシュボードに載せる指標

次の話

この記事の感想を教えてください

まずは、現状を聞かせてください。