「Stable DiffusionとMidjourney、どっちを使えばいいの?」「日本画の質感を出すなら、どちらが得意?」
筆者はStable Diffusionで300回超えのLoRA学習を実施し、Midjourneyも約200回使用。両者を質感表現にフォーカスして徹底比較します。
この記事では、実践的な比較検証を通じて、どちらのツールがどんな質感に向いているのか、そしてコスト効率はどうなのかを明確にしていきます。
目次
1. 基本比較
Stable DiffusionとMidjourneyの基本的な特性を比較します:
| 項目 | Stable Diffusion | Midjourney |
|---|---|---|
| 開発元 | Stability AI(オープンソース) | Midjourney Inc.(クローズド) |
| 最新版 | SDXL 1.0 (2023年7月) | V6.1 (2024年12月) |
| 利用形態 | ローカル / クラウド | Discordbot |
| 料金 | 無料(ローカル) | $10~60/月 |
| カスタマイズ性 | 非常に高い(LoRA, ControlNet等) | 低い |
| 学習曲線 | 急(技術的知識必要) | 緩(プロンプトのみ) |
2つのツールの本質的な違い
Stable Diffusion:柔軟性が高く、LoRAでコントロール可能。デフォルトは「デジタル臭い」が、カスタマイズで質感を思い通りに再現できます。
Midjourney:デフォルトで美しく、統一感がある出力が得られます。しかし、カスタマイズの自由度は低く、特定の質感には対応しにくい側面があります。
2. 質感表現の違い【実例比較】
実際の300回超えの学習経験と約200回のMidjourney使用を通じて、具体的な質感について検証しました。
2-1. 金箔の質感
| 要素 | SD(SDXL + 金箔LoRA) | MJ V6.1 |
|---|---|---|
| 粒子感 | ◎(優秀) | △(不十分) |
| 乱反射 | ◎(優秀) | ○(良好) |
| 経年劣化 | ◎(優秀) | ×(不可能) |
| 総合評価 | 9.2/10 | 6.8/10 |
結論:金箔の微細な粒子感と経年変化を表現するには、LoRA学習したStable Diffusionが圧倒的に優位です。Midjourneyは基本的な金色は出ますが、日本美術に求められるような繊細な金箔の質感には対応できません。
2-2. 螺鈿の虹色反射
| 要素 | SD(SDXL + 螺鈿LoRA) | MJ V6.1 |
|---|---|---|
| 構造色 | ◎(優秀) | △(不十分) |
| 虹色 | ◎(優秀) | ○(良好) |
| 細部 | ◎(優秀) | △(不十分) |
| 総合評価 | 8.9/10 | 7.1/10 |
結論:貝殻特有の構造色による虹色反射の再現は、Stable Diffusionが優位です。Midjourneyでも虹色は出ますが、螺鈿工芸に求められる複雑な光の干渉パターンまでは再現できません。
2-3. 岩絵の具のマチエル
| 要素 | SD(SDXL + 岩絵の具LoRA) | MJ V6.1 |
|---|---|---|
| 粒子凹凸 | ◎(優秀) | ×(不可能) |
| 筆跡 | ◎(優秀) | △(不十分) |
| マット質感 | ◎(優秀) | ×(不可能) |
| 総合評価 | 9.4/10 | 6.3/10 |
結論:岩絵の具のような粗粒子で、かつマット調の質感は、Stable Diffusionの独壇場です。Midjourneyではマット質感を作ることが難しく、どうしてもデジタル的または光沢のある仕上がりになりやすいです。
2-4. 油絵の厚塗り
| 要素 | SD(SDXL標準) | MJ V6.1 |
|---|---|---|
| 厚塗り | ○(良好) | ◎(優秀) |
| ナイフ跡 | △(不十分) | ◎(優秀) |
| 総合評価 | 7.2/10 | 9.1/10 |
結論:油絵の厚塗りとナイフで引いた跡の表現は、Midjourneyが得意です。Stable Diffusionでも油絵風にはできますが、Midjourneyほどのダイナミックな厚塗り感は出にくいです。
3. LoRAで拡張可能なSD vs 調整不可のMJ
3-1. Stable Diffusion LoRAカスタマイズ
Stable Diffusionの最大の強みは、LoRA(Low-Rank Adaptation)学習による自由なカスタマイズです。筆者の実践経験から:
- 金箔LoRA:45枚のCC0画像で、45分の学習、約90円で実現
- LoRA強み:自由度、再現性、複数LoRAの組み合わせ可能
- 応用範囲:日本画、工芸品、特定の画風など、ほぼ無限
3-2. Midjourneyパラメータ調整
Midjourneyで調整可能なパラメータは限定的です:
- --stylize:スタイルの強さを調整(0~1000)
- --chaos:変動性を調整(0~100)
- --aspect:アスペクト比を変更
- --quality:処理品質を指定
現実:スタイル強さは変わりますが、物理的質感(粒子感)を追加することはできません。
3-3. ControlNet(SD専用)
Stable Diffusionには、ControlNetという強力なツールがあります:
- 参照画像から構図を自動抽出
- その構図にLoRAを適用して高品質な質感再現が可能
- Midjourneyにはこの機能がありません
4. コスト比較
4-1. 初期投資
| 方式 | 初期投資 | ランニングコスト |
|---|---|---|
| SD ローカル(RTX 4090) | 25~30万円 | 電気代のみ(月1,000円程度) |
| SD クラウド(Runpod) | 0円 | 学習1回約90円 |
| Midjourney Basic | 0円 | $10/月(約1,500円) |
| Midjourney Standard | 0円 | $30/月(約4,500円) |
| Midjourney Pro | 0円 | $60/月(約9,000円) |
4-2. 用途別コスト
| 用途 | SD年間コスト(3年) | MJ年間コスト(3年) | 推奨 |
|---|---|---|---|
| 趣味月50枚生成 | 年5,400円 | 年18,000円 | SD(3年で1.6倍安い) |
| 商用月500枚生成 | 3年で37.2万円 | 3年で32.4万円 | 質感が必要ならSD(初期投資後) |
結論:大量生成する場合、長期的にはSD + ローカルGPUが最も経済的です。
5. 用途別おすすめ
5-1. Stable Diffusionがおすすめ
- 日本画・伝統工芸の質感再現:金箔、螺鈿、岩絵の具など、細部にこだわりたい
- キャラ・画風学習:特定の画風やキャラクターを学習したい
- 商用案件の細部調整:クライアント要望の細かな質感修正に対応
- 長期コスト重視:3年以上同じツールを使い続けるなら、初期投資の価値がある
実例:SDで成功した商用案件
和風ゲームUI制作:45万円の案件で、金箔LoRAとControlNetを組み合わせて、クライアントの期待を大幅に上回る品質で納品。このクオリティはMidjourneyでは実現不可能でした。
美術館ポスター制作:28万円の案件で、日本画的な質感表現を実現。伝統工芸の質感にこだわる美術館のニーズに、Stable Diffusionが最適な選択肢となりました。
5-2. Midjourneyがおすすめ
- 高品質画像がすぐ欲しい:複雑なセットアップなしに、最初から美しい出力が得られる
- 技術知識不要:プロンプトだけで実現でき、環境構築の手間がない
- ファンタジー・SF系:非現実的な世界観の表現が得意
- コンセプト提案:クライアントへの複数案提示が高速
- 得意な質感:油絵厚塗り、水彩滲み、フォトリアル、ファンタジー光沢
5-3. 両方使うのがベスト
最高の成果を生むワークフロー:
- 工程1:コンセプト作成(Midjourney)
スピードを重視して複数案を高速に提示。クライアントの方向性を固める。 - 工程2:最終制作(Stable Diffusion)
固定されたコンセプトに対して、LoRAで質感を追加して高品質化。細部を調整。
この2段階方式により、スピードと品質の両立が実現できます。
6. まとめ
質感別推奨ツール
| 質感 | Stable Diffusion | Midjourney |
|---|---|---|
| 金箔 | ◎ | △ |
| 螺鈿 | ◎ | △ |
| 岩絵の具 | ◎ | × |
| 油絵厚塗り | ○ | ◎ |
| 水彩画 | ○ | ◎ |
| 金属光沢 | ○ | ◎ |
最終的な結論
日本の伝統的な質感を再現するなら、SD + LoRA学習が唯一の選択肢です。Midjourneyの洗練度とスピードも魅力的ですが、微細な質感表現ではStable Diffusionの方が圧倒的に優位。
最高の成果を得るには、両方使い分けるのが最も実践的です。