DCAIさんの記事がキャラクターLoRA用のデータセット作成を体系的にまとめている。本記事は「キャラ」ではなく「質感」——マチエールをAIに学習させるためのデータセットに特化する。
1. 質感LoRAに必要な画像とは何か
「形」ではなく「表面の物性」を学ばせる
キャラクターLoRAが学習するのは「形」だ。質感LoRAが学習するのは「表面の物性」だ。金箔のクラックのパターン、厚塗り絵具の盛り上がりの陰影、漆の深い光沢——これらは被写体の構造ではなく、表面そのものの性質だ。
質感撮影の3原則
博物館の美術品撮影プロトコルから借りてくるべき原則が3つある。
1. 統一された照明条件
照明が画像ごとに異なると、LoRAは「質感」ではなく「照明の違い」を学んでしまう。45度の角度から均一な拡散光を当てるのが基本。
2. 被写体からの距離が一定
マクロ撮影で極端に寄った画像と引いた画像が混在すると、LoRAは「スケールの変化」を学習してしまう。
3. 背景の排除
背景のテーブルの木目や壁の色がLoRAに混入する。単色の背景(グレーの布が最適)を使うか、トリミングで背景を除去する。
2. 撮影機材と条件(予算別)
| 予算 | 機材 | ポイント |
|---|---|---|
| 0〜3,000円 | スマートフォン+自然光制御 | 窓際でトレーシングペーパーをディフューザーに。一度に全枚数を撮影 |
| 3,000〜10,000円 | スマホ+LEDライト+三脚 | 45度からメインライト、反対側にレフ板。照明条件を完全コントロール |
| 10,000円以上 | ミラーレス一眼+マクロレンズ | F8〜F11まで絞ってピント面確保。三脚必須 |
「質感を殺す照明」と「質感を活かす照明」
質感を殺す照明——正面からのフラッシュ光。表面の凹凸が影を作らないため、のっぺりした画像になる。
質感を活かす照明——斜め45度からのサイドライト。表面の凹凸が影を落とし、マチエールの立体感が鮮明に浮かび上がる。博物館でレリーフや油絵を照らすときの手法そのものだ。
3. 画像選定の基準——何を残し何を捨てるか
30枚撮って15枚に厳選する
質感LoRAの学習画像は20〜30枚が適量だ。まず30枚以上を撮影し、以下のチェックリストで厳選して15〜20枚に絞る。
必須条件(1つでも該当したら除外)
- ピンボケしていないか?
- 手ブレしていないか?
- 照明が他の画像と明らかに異なっていないか?
- 反射(テカリ)が質感を覆い隠していないか?
- 背景が写り込んでいないか?
推奨条件(品質をさらに上げる)
- 素材の「代表的な質感」が画面の80%以上を占めているか?
- 質感のバリエーションがデータセット全体でカバーされているか?
- 色彩が極端に偏っていないか?
鉄則
学習データの質は、完成LoRAの質の上限を決める。dim=128に設定しても、学習画像が悪ければdim=32と同程度の結果しか出ない。
4. キャプション付けの考え方
質感LoRAのキャプションはキャラLoRAと異なる
トリガーワード + 素材の物性記述という構成にする。
金箔(Kinpaku)の例
kinpaku_texture, gold leaf surface, fine irregular cracks,
warm metallic reflection, subtle oxidation tones,
overlapping foil boundary lines
厚塗り(Atsunuri)の例
atsunuri_texture, thick impasto paint surface,
palette knife ridges, visible paint strokes direction,
layered pigment depth, rough tactile surface
漆(Urushi)の例
urushi_texture, japanese lacquer surface, deep glossy finish,
multiple coating layers visible, subtle color depth variation,
smooth yet organic surface quality
トリガーワードの設計思想
トリガーワードは「一般的な英単語と被らない固有語」にすること。SHIFUKU Seriesでは、全てのLoRAに [素材名のローマ字]_texture 形式のトリガーワードを設定している。
5. まとめ:データセット構成例——金箔LoRAの場合
フォルダ構成
kinpaku_lora_dataset/
├── 15_kinpaku_texture/
│ ├── kinpaku_001.png
│ ├── kinpaku_001.txt
│ ├── kinpaku_002.png
│ ├── kinpaku_002.txt
│ └── ... (20枚)
データセット仕様
| 項目 | 内容 |
|---|---|
| 画像枚数 | 20枚(30枚撮影→厳選) |
| 画像解像度 | 2048px以上(学習時に自動リサイズ) |
| ファイル形式 | PNG(非圧縮) |
| 照明 | LEDパネルライト×2(45度+レフ板) |
| 背景 | グレー布(ニュートラルグレー) |
| キャプション | トリガーワード+素材物性記述(英語) |
20枚の厳選された撮影画像と、素材の物性を正確に記述したキャプション。この2つが揃えば、質感LoRAは驚くほど忠実に素材の「手触り」を再現する。