ふくふくHukuhuku Inc.
EP.07LLM Gamedev 13分公開: 2026-05-26

アセット生成統合 ── Stable Diffusion / Meshy / Suno でゲームを満たす

ゲーム開発のアセット (画像 / 3D モデル / 音楽 / SFX / 音声) を生成 AI で揃える実用ワークフロー。Stable Diffusion / FLUX / Meshy / TripoSR / Suno / ElevenLabs / Mubert のゲーム開発適性比較。

#アセット生成#Stable Diffusion#Meshy#Suno#ElevenLabs
執筆 / 監修
松尾 亮合同会社ふくふく 代表社員

データ基盤・データパイプライン構築 / BI / 生成 AI 活用支援を専門とするエンジニア (28 年)。 本記事は AI 利用ポリシーに基づき、生成 AI の補助で執筆 → 人間が監修・編集して公開しています。

プロフィール詳細
シェア

EP.07 は アセット生成統合。コード生成だけでなく、画像 / 3D / 音楽 / SFX / 音声 まで生成 で揃える実用ワークフロー。 で立ち絵 / 背景、Meshy で 3D モデル、Suno で BGM、ElevenLabs で SFX / 音声 ── 1 人インディーがゼロから完成品を出すサイクルが急速に短くなっています。

1. ゲームアセットのカテゴリと生成 AI

カテゴリ代表ツール (2026 年時点)実用度向く規模
2D スプライトStable Diffusion XL / FLUX.1 / PixelLab全規模
ピクセルアートSDXL + pixel-art LoRA / PixelLab中-高インディー / ゲームジャム
3D モデル (low-poly)Meshy / Rodin / TripoSRプロトタイプ / インディー
3D モデル (game-ready)Meshy + 手直し低-中プロトタイプのみ
テクスチャ (PBR)Stable Diffusion + ControlNet / Substance Stager全規模
BGMSuno / Udio / Stable Audio全規模 (ループ加工要)
SFXElevenLabs Sound Effects / Stable Audio Open全規模
音声 (セリフ)ElevenLabs / Voicevox全規模
UI アイコンStable Diffusion + ControlNet全規模

2. 2D スプライトの生成パイプライン

Stable Diffusion API 経由でスプライト生成 (Replicate)
Python
import replicateimport os
# 環境変数 REPLICATE_API_TOKEN を設定output = replicate.run(    "stability-ai/stable-diffusion-3.5-large",    input={        "prompt": "pixel art game character, 32x32, side view, "                  "knight with sword, transparent background",        "negative_prompt": "blurry, low quality, realistic, photograph",        "width": 512,        "height": 512,        "num_outputs": 4,    })
# 結果を保存os.makedirs("assets/sprites", exist_ok=True)for i, url in enumerate(output):    import urllib.request    urllib.request.urlretrieve(url, f"assets/sprites/knight_{i}.png")print(f"Saved {len(output)} sprites to assets/sprites/")
スプライトシート化

個別画像 → スプライトシート の変換は ImageMagick + Aseprite が定番。`magick *.png -append spritesheet.png` で縦結合。Aseprite で位置調整 + アニメーション設定 + 個別出力。Godot/Unity は両方対応。

3. 3D モデル生成 (Meshy / TripoSR)

「画像から 3D」 と 「テキストから 3D」 の 2 経路。テキストから直接は概念出し止まり、画像経由の方が実用度が高い。 で立ち絵を生成 → Meshy で 3D に → / で取込み が現実的なパイプライン。

Meshy API 経由 (画像 → 3D)
Bash
# Meshy API トークンを取得 (https://meshy.ai)curl -X POST https://api.meshy.ai/v1/image-to-3d \  -H "Authorization: Bearer $MESHY_API_KEY" \  -H "Content-Type: application/json" \  -d '{    "image_url": "https://your-image-host/character.png",    "ai_model": "meshy-4",    "enable_pbr": true,    "topology": "quad"  }'
# レスポンスで task_id を取得、ステータスをポーリングして# 完成後に GLB / FBX / USDZ 等でダウンロード

4. テクスチャ生成 (PBR マテリアル)

  • Stable Diffusion + ControlNet (Tile / Depth): シームレスタイル生成可
  • Substance Sampler (Adobe): 写真から PBR マテリアル抽出
  • Materialize (無料 OSS): アルベドから normal/roughness 推定
  • Poly Haven / ambientcg.com: CC0 ライセンスの人手 PBR ライブラリ (生成 AI に頼らない選択肢)

5. BGM 生成 (Suno API 例)

Suno で BGM 生成 + ループ加工
Python
# Suno API は招待制 / 一部 SDK# 代替として Stable Audio Open (HuggingFace) も使える
# 生成後の典型的な後処理 (pydub でループ点処理)from pydub import AudioSegment
bgm = AudioSegment.from_file("generated_bgm.wav")
# クロスフェード ループ (前後 2 秒をクロス)def make_loopable(audio: AudioSegment, crossfade_ms: int = 2000) -> AudioSegment:    tail = audio[-crossfade_ms:]    head = audio[:crossfade_ms]    middle = audio[crossfade_ms:-crossfade_ms]    # 末尾を頭にフェードしてループ可能に    return middle.append(head, crossfade=crossfade_ms)
loopable = make_loopable(bgm)loopable.export("assets/bgm/main_loop.ogg", format="ogg",                parameters=["-q:a", "6"])  # OGG 品質 6 (中)

6. SFX 生成 (ElevenLabs Sound Effects)

コマンドラインから SFX 生成
Bash
# ElevenLabs Sound Effects APIcurl -X POST https://api.elevenlabs.io/v1/sound-generation \  -H "xi-api-key: $ELEVENLABS_API_KEY" \  -H "Content-Type: application/json" \  -d '{    "text": "sword slash with metallic ring, fantasy game",    "duration_seconds": 1.0,    "prompt_influence": 0.7  }' \  --output assets/sfx/sword_slash.mp3

実行時に動的セリフを生成する場合は EP.08 (実行時 NPC) と組合せ、開発時に台詞固定なら 1 回生成してデータ同梱でコストゼロ。 のようなノベルゲームエンジンとの相性も抜群。

7. 音声生成 (キャラのセリフ)

ツール得意料金感商用利用
ElevenLabs多言語・感情表現$5-99/月プラン依存、最上位は OK
OpenAI TTS (gpt-4o-tts)英語自然、Realtime API も$0.015/1k 文字OK
Voicevox日本語ゆっくり系無料条件付き OK (キャラ毎)
COEIROINK日本語、感情豊か無料条件付き OK
Murfナレーション系$19-99/月OK

8. ゲーム規模別の生成戦略

  • ゲームジャム (48 時間): 全アセットを生成 AI で速攻、品質より速度
  • インディー個人 (3-6 ヶ月): コアアセット (主人公・ボス・主要 BGM) は時間掛けて生成 + 手修正、その他は生成丸投げ
  • 小規模スタジオ (1 年+): アートディレクター人手 + 量産は生成 + 仕上げ人手 のハイブリッド
  • AAA: 生成 AI は コンセプト段階のみ、量産は人手 + プロシージャル (ライセンス・クオリティ要件で)

9. ストア (Steam / itch.io) の AI 開示要件

  • Steam: 2024 年から AI 生成コンテンツの開示が必須、ストアページに記載
  • itch.io: 開示推奨 (タグ付け推奨、強制ではない)
  • App Store / Google Play: 開示要求は段階的に強化中
  • 実務的対応: ストアページに 「BGM の一部に生成 AI を使用」 のように具体に明記

10. 著作権・倫理の落とし穴

ライセンス確認は必須

各ツールの利用規約 + 元となる checkpoint / model のライセンス を必ず確認する。特に Stable Diffusion 系は基本モデルが商用 OK でも、特定の checkpoint や LoRA が非商用ライセンスのことが多い。Civitai 等で配布されている LoRA は個別ライセンスを目で見て確認 (Apache / MIT / 非商用 / CreativeML OpenRAIL-M など混在)。

11. 次の話

EP.08 は NPC を実行時 LLM で動かす ── 開発時生成ではなく、ゲーム実行中に LLM API を呼んで NPC の会話・行動を動的生成するパターン。プロンプト設計とコスト管理が主役。

シェア

この記事の感想を教えてください

あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。

シリーズの外も探す:

まずは、現状を聞かせてください。

要件が固まっていなくて大丈夫です。現状診断と方針提案までを無料でお手伝いします。

無料相談フォームへ hello [at] hukuhuku [dot] co [dot] jp