Loading...
画像生成AI
2024/6/20

5つの機能で画像の細部を表現
画像生成AIの手法〜応用編①〜

こんにちは!VONS picturesです。

第15回目のメルマガは、AIを使った画像生成の手法〜応用編①〜です。前回のメルマガでは、画像生成AIに必要不可欠な「プロンプト」を使った、基本的な画像の作り方を説明しました。今回は応用編として、AIで画像を作りたいときに使える4つの機能を紹介します。

●インペイント機能
●アウトペイント機能
●ControlNet機能
●機械学習

これらの機能を活用すると、細かい箇所を指定したり修正したりしながら、より理想に近い詳細な画像を自動生成できます。実際にどのような画像ができるか紹介しながらお伝えするので、ぜひご覧ください!

インペイント機能

インペイント機能は、画像の一部を修正して補いたいときに便利な機能です。黒く塗りつぶした修正箇所にプロンプトを適用し、画像を変更します。インペイント機能を使うと、周囲の情報や画像全体の背景知識に基づいて適切なピクセル情報が生成されます。

画像生成時のモデルやプロンプト、シード値などを必ずしも合わせる必要はなく、オリジナル画像に自然に馴染むようAIが調整する点が特徴です。画像の一部分を修正するために、何度も一から作成する必要がないので、効率的に画像を作り出せます。

こちらが、インペイント機能を使用した画像の変化です。左が元画像、真ん中が修正範囲の指定(Inpaint Mask)、右が修正後の画像です。真ん中の画像にある黒く塗りつぶされた箇所に対し、プロンプトが適用されています。

<プロンプトの日本語訳>

最高画質、超高画質、(フォトリアリスティック:1.4)、lgirl、優しい瞳の写真、 (アナログ写真)、(詳細)、 スタジオ品質、 8k、 4k、 whd、 (((フォトリアリスティック))、 ((詳細))、 転送、 (アナログ写真)、 (詳細)、 スタジオ品質、8k、 4k、 uhd、 (((フォトリアリスティック)))、 ((詳細)) - 転送

絵画、 スケッチ、 (最低画質:2)、(低画質:2)、 (通常画質:2)、 lowres、 通常画質、 モノクローム、 グレースケール、にきび、 しみ、 加齢斑、 しわ、 ((ペインティング))、 ((ドローイング))、 ((スケッチ))、 ((カメラ))、 ((レンダリング))、(((トリミング)))、 (((透かし)))、 (クロゴ)、 ((バーコード))、((UI))、((署名))、((テキスト))、 (tlabel))、((エラー))、 ((タイトル))、 ステッカー、 マーク、 吹き出し、 ライン、 切り抜き、 低解像度、 低品質、 アーチファクト、 ((ペインティング))、((描画))、 ((スケッチ))、 ((カメラ))、((レンダリング))、(((トリミング)))、(((透かし))、 ((ロゴ))、((バーコード))、 ((アン))、 ((署名))、((テキスト))、((ラベル))、((エラーj))、((タイトル))、ステッカー、 マーク、 吹き出し、 ライン、 トリミング、 低解像度、 低画質、 アーチファクト

アウトペイント機能

アウトペイント機能は、途中で切れている画像を延長したいときに活用できます。画像生成時のモデルやプロンプト、シード値などを合わせることによって、延長部分の画像精度が上がります。プロンプトやシード値がわからない、または無い場合でも、「fill in(埋める)」などのシンプルなプロンプトで延長が可能です。

アウトペイント機能を使った画像の例を見てみましょう。左側の車の端が見切れた画像に対してプロンプトで指示を出すと、車と背景が自然に補完された右側の画像が作成されます。オリジナル画像と整合性を取りながら、画像が拡張されたことがわかります。

<プロンプトの日本語訳>

mdjrny-v4の写真、複雑なスチームパンクデザインの車の3dアルファ、詳細なテクスチャ、3dテクスチャ、 ((アナログ写真))、(詳細)、 スタジオクオリティ、 8k、 4k、 uhd、 (((フォトリアリスティック)))、((詳細))、 トランスファー、 ドリブル、 精密主義、 関連報道写真、 受賞歴あり

ネガティブプロンプト:((絵画)), ((描画)), ((スケッチ)), ((カメラ)), ((レンダリング))

ControlNet機能

ControlNetは、画像からレイアウトや顔の表情などさまざまな情報を抽出し、新しい画像を生み出す機能です。人物やキャラクターに特定のポーズを取らせたり、細かい顔の表情を指定したりできます。プロンプトだけではレイアウトが崩壊してしまう場合、ControlNet機能で解決できます。

レイアウト制御

これは、ControlNet機能を使ってレイアウト制御をした画像です。左側のレイアウトに対し、プロンプトとしてテキストで指示することで、同じポーズの画像を自動生成しました。

<プロンプトの日本語訳>

最高品質、 超高解像度、 (フォトリアリスティック: 1.4)、 1ガールニット、 ショートヘア、 (クローズアップ)、 ワイドアングル、 (ローアングル)、(人を見る)、背景なし、

ネガティブプロンプト:絵画、スケッチ、(最低画質:2)、(低画質:2)、(通常画質:2)、低画質、 普通画質、 ((モノクロ))、 ((グレースケール))、 皮膚のシミ、 ニキビ、 加齢によるシミ、 しわ

レイアウト制御の例をもうひとつ見てみましょう。帽子を被った女性のレイアウトに対し、プロンプトを使って右側の女性の画像が自動生成されました。

<プロンプトの日本語訳>

最高品質, 超高解像度, (フォトリアリスティック:1.4)、1人の女性、 キャップを着用、 ショートヘア、 (クローズアップ)、 ワイドアングル、(ローアングル)、 (人を見る)、背景なし

ネガティブプロンプト:絵画、スケッチ、(最低画質:2)、(低画質:2)、(通常画質:2)、低画質、 普通画質、 ((モノクロ))、 ((グレースケール))、 皮膚のシミ、 ニキビ、 加齢によるシミ

また、一つのスニーカーのレイアウトから、さまざまな種類の靴を自動生成することも可能です。色や素材、背景が異なる靴を、自由自在に生み出せます。

表情制御

ControlNet機能の表情制御を使うと、従来は難しかった表情だけの指定が簡単にできるようになり、表現の幅が広がります。

左側のオリジナル画像から表情を読み取り、右側にある同じ表情の新たな画像を作り出しています。

機械学習

既存のAIモデルに画像を追加学習させる「機械学習」を用いて、新たな画像を作り出せます。機械学習といっても大量のデータは必要なく、教師データとなる画像の枚数は10枚程度で大丈夫です。機械学習の手法を使うことで、学習済みのネットワークを自分好みに変更できます。

では、実際に機械学習で生成した画像を見てみましょう。ここでは、VONS picturesのオフィス犬「ヴォン太」の写真を追加学習させて、ヴォン太が宇宙旅行をするデザインの年賀状を作成しました。

まずは、以下の教師データをAIモデルに追加学習させます。

次に、プロンプトを入力して「ヴォン太」と「宇宙船の窓の様子」の画像をAIで自動作成し、年賀状のデザインに仕上げます。

<プロンプトの日本語訳>

レッドシフトスタイルの写真、 ドッグボンタ((宇宙服ヘルメット着用))、 月面でジャンプ、 シャープフォーカス、 ((全身))、 ((アナログ写真))、 (詳細)、 スタジオ画質、 8k、 4k、 uhd、 (フォトリアリスティック))、 ((詳細))、 転写、 ドリブル、 精密主義、 関連報道写真、 受賞歴あり

ネガティブプロンプト:、 ((絵画))、 ((デッサン))、 ((スケッチ))、 ((カメラ))、 ((レンダリング))、(((切り抜き)))、(((透かし)))、((ロゴ))、((バーコード))、((UI))、((サイン))、 ((テキスト))、 ((ラベル))、 ((エラー))、 ((タイトル))、 ステッカー、 マーキング、 吹き出し、 ライン、 切り抜き、ローレゾ、低画質、アーチファクト

<プロンプトの日本語訳>

レッドシフトスタイルの写真、美しい複雑なファインアート、宇宙空間の宇宙船の窓を外側から見た写真、中央、左右対称、アナログ写真、フィルムグレイン、宇宙空間の宇宙船の窓の眺め、中央、対称、アナログ写真、フィルムグレイン、((アナログ写真))、 (詳細)、 スタジオクオリティ、 8k、 4k、 uhd、 (((フォトリアリスティック)))、 ((詳細))、 転送

ネガティブプロンプト: 霧、 バックライト、((絵画))、 ((描画))、 ((スケッチ))、 ((カメラ))、 ((レンダリング))、 (((切り抜き)))、(((透かし)))、((ロゴ))、((バーコード))、((UI))、((署名))、((テキスト))、((ラベル))、((エラー))、 ((タイトル))、 ステッカー、 マーク、 吹き出し、 ライン、 切り抜き、 低解像度、 低品質、 アーチファクト

まとめ

今回は、画像生成AIの応用編として、4つの機能を紹介しました。インペイント機能、アウトペイント機能、ControlNet機能、機械学習を駆使することで、質の高い画像を自動作成できます。画像生成AIを広告制作に活用すると、時間を大幅に短縮しながら複数のクリエイティブの作成が可能です。

VONS picturesは、今後AIがクリエイティブの世界に急速に浸透していくと考え、AIを使って企業やデザイナーを支援する事業を展開していきます。AIガバナンスを重視し、データプライバシーと倫理的な枠組みを守りながら、AIの力を最大限に活かした広告制作に取り組みます。

VONS picturesは、最先端技術とこれまでのクリエイティブスキルを融合して新たなソリューションを皆さまにお届けします。ご関心がありましたら、ぜひお気軽にお問合せください。

もっと詳しく知りたい方へ

株式会社ヴォンズ・ピクチャーズ 
デジタルコンテンツ研究所

詳細はこちら

記事は参考になりましたでしょうか?