EP.07 は アセット生成統合。コード生成だけでなく、画像 / 3D / 音楽 / SFX / 音声 まで生成 で揃える実用ワークフロー。 で立ち絵 / 背景、Meshy で 3D モデル、Suno で BGM、ElevenLabs で SFX / 音声 ── 1 人インディーがゼロから完成品を出すサイクルが急速に短くなっています。
1. ゲームアセットのカテゴリと生成 AI
| カテゴリ | 代表ツール (2026 年時点) | 実用度 | 向く規模 |
|---|---|---|---|
| 2D スプライト | Stable Diffusion XL / FLUX.1 / PixelLab | 高 | 全規模 |
| ピクセルアート | SDXL + pixel-art LoRA / PixelLab | 中-高 | インディー / ゲームジャム |
| 3D モデル (low-poly) | Meshy / Rodin / TripoSR | 中 | プロトタイプ / インディー |
| 3D モデル (game-ready) | Meshy + 手直し | 低-中 | プロトタイプのみ |
| テクスチャ (PBR) | Stable Diffusion + ControlNet / Substance Stager | 高 | 全規模 |
| BGM | Suno / Udio / Stable Audio | 高 | 全規模 (ループ加工要) |
| SFX | ElevenLabs Sound Effects / Stable Audio Open | 高 | 全規模 |
| 音声 (セリフ) | ElevenLabs / Voicevox | 高 | 全規模 |
| UI アイコン | Stable Diffusion + ControlNet | 高 | 全規模 |
2. 2D スプライトの生成パイプライン
import replicateimport os
# 環境変数 REPLICATE_API_TOKEN を設定output = replicate.run( "stability-ai/stable-diffusion-3.5-large", input={ "prompt": "pixel art game character, 32x32, side view, " "knight with sword, transparent background", "negative_prompt": "blurry, low quality, realistic, photograph", "width": 512, "height": 512, "num_outputs": 4, })
# 結果を保存os.makedirs("assets/sprites", exist_ok=True)for i, url in enumerate(output): import urllib.request urllib.request.urlretrieve(url, f"assets/sprites/knight_{i}.png")print(f"Saved {len(output)} sprites to assets/sprites/")個別画像 → スプライトシート の変換は ImageMagick + Aseprite が定番。`magick *.png -append spritesheet.png` で縦結合。Aseprite で位置調整 + アニメーション設定 + 個別出力。Godot/Unity は両方対応。
3. 3D モデル生成 (Meshy / TripoSR)
「画像から 3D」 と 「テキストから 3D」 の 2 経路。テキストから直接は概念出し止まり、画像経由の方が実用度が高い。 で立ち絵を生成 → Meshy で 3D に → / で取込み が現実的なパイプライン。
# Meshy API トークンを取得 (https://meshy.ai)curl -X POST https://api.meshy.ai/v1/image-to-3d \ -H "Authorization: Bearer $MESHY_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "image_url": "https://your-image-host/character.png", "ai_model": "meshy-4", "enable_pbr": true, "topology": "quad" }'
# レスポンスで task_id を取得、ステータスをポーリングして# 完成後に GLB / FBX / USDZ 等でダウンロード4. テクスチャ生成 (PBR マテリアル)
- Stable Diffusion + ControlNet (Tile / Depth): シームレスタイル生成可
- Substance Sampler (Adobe): 写真から PBR マテリアル抽出
- Materialize (無料 OSS): アルベドから normal/roughness 推定
- Poly Haven / ambientcg.com: CC0 ライセンスの人手 PBR ライブラリ (生成 AI に頼らない選択肢)
5. BGM 生成 (Suno API 例)
# Suno API は招待制 / 一部 SDK# 代替として Stable Audio Open (HuggingFace) も使える
# 生成後の典型的な後処理 (pydub でループ点処理)from pydub import AudioSegment
bgm = AudioSegment.from_file("generated_bgm.wav")
# クロスフェード ループ (前後 2 秒をクロス)def make_loopable(audio: AudioSegment, crossfade_ms: int = 2000) -> AudioSegment: tail = audio[-crossfade_ms:] head = audio[:crossfade_ms] middle = audio[crossfade_ms:-crossfade_ms] # 末尾を頭にフェードしてループ可能に return middle.append(head, crossfade=crossfade_ms)
loopable = make_loopable(bgm)loopable.export("assets/bgm/main_loop.ogg", format="ogg", parameters=["-q:a", "6"]) # OGG 品質 6 (中)6. SFX 生成 (ElevenLabs Sound Effects)
# ElevenLabs Sound Effects APIcurl -X POST https://api.elevenlabs.io/v1/sound-generation \ -H "xi-api-key: $ELEVENLABS_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "text": "sword slash with metallic ring, fantasy game", "duration_seconds": 1.0, "prompt_influence": 0.7 }' \ --output assets/sfx/sword_slash.mp3実行時に動的セリフを生成する場合は EP.08 (実行時 NPC) と組合せ、開発時に台詞固定なら 1 回生成してデータ同梱でコストゼロ。 のようなノベルゲームエンジンとの相性も抜群。
7. 音声生成 (キャラのセリフ)
| ツール | 得意 | 料金感 | 商用利用 |
|---|---|---|---|
| ElevenLabs | 多言語・感情表現 | $5-99/月 | プラン依存、最上位は OK |
| OpenAI TTS (gpt-4o-tts) | 英語自然、Realtime API も | $0.015/1k 文字 | OK |
| Voicevox | 日本語ゆっくり系 | 無料 | 条件付き OK (キャラ毎) |
| COEIROINK | 日本語、感情豊か | 無料 | 条件付き OK |
| Murf | ナレーション系 | $19-99/月 | OK |
8. ゲーム規模別の生成戦略
- ゲームジャム (48 時間): 全アセットを生成 AI で速攻、品質より速度
- インディー個人 (3-6 ヶ月): コアアセット (主人公・ボス・主要 BGM) は時間掛けて生成 + 手修正、その他は生成丸投げ
- 小規模スタジオ (1 年+): アートディレクター人手 + 量産は生成 + 仕上げ人手 のハイブリッド
- AAA: 生成 AI は コンセプト段階のみ、量産は人手 + プロシージャル (ライセンス・クオリティ要件で)
9. ストア (Steam / itch.io) の AI 開示要件
- Steam: 2024 年から AI 生成コンテンツの開示が必須、ストアページに記載
- itch.io: 開示推奨 (タグ付け推奨、強制ではない)
- App Store / Google Play: 開示要求は段階的に強化中
- 実務的対応: ストアページに 「BGM の一部に生成 AI を使用」 のように具体に明記
10. 著作権・倫理の落とし穴
各ツールの利用規約 + 元となる checkpoint / model のライセンス を必ず確認する。特に Stable Diffusion 系は基本モデルが商用 OK でも、特定の checkpoint や LoRA が非商用ライセンスのことが多い。Civitai 等で配布されている LoRA は個別ライセンスを目で見て確認 (Apache / MIT / 非商用 / CreativeML OpenRAIL-M など混在)。
11. 次の話
EP.08 は NPC を実行時 LLM で動かす ── 開発時生成ではなく、ゲーム実行中に LLM API を呼んで NPC の会話・行動を動的生成するパターン。プロンプト設計とコスト管理が主役。
この記事の感想を教えてください
あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。