- 週間ランキング
テキストを入力することで、自動的に画像を生成してくれる画像生成AI。多くのサービスやアプリ、また生成された画像のギャラリーなどが存在しています。
どのようなサービスやアプリがあるのか、そしてユーザーコミュニティなど、画像生成AIに関する様々なサイトをまとめてみました。
画像生成AIの仕組みは、希望する画像の要素を「プロンプト」と呼ばれるテキストで入力すると、AIがネットや事前に登録されている画像の中から求められる要素を抽出し、整合させて1枚の画像として生成(出力)するというもの。サービスによって、要素の抽出や整合させる過程に特色があり、求める画像の方向性によって使い分けると便利です。
日本で人気なのが、アメリカのAnlatanが提供している「NovelAI」。その名の通り、もともとはOpenAIが開発した学習モデルGPTを利用して小説(Novel)など文章を生成するAIサービスとしてスタートしました。
何もない状態から作り始めることもできますが、ダークファンタジーやドラゴンといったテーマのプリセット、コナン・ドイルやラヴクラフトのような作家の作風がプリセットとして用意されており、テキストで指示することによって「コナン・ドイルが剣と魔法のファンタジー小説を書いたら」といったお遊びも可能となっています。
これに挿絵を生成するサービス(NovelAI Diffusion)が加わったのですが、いわゆる「ラノベ風」のイラストを作りやすいのが特徴。もちろんリアル寄りのイラストも生成可能です。またテキストだけでなく「Image2Image」と呼ばれる、アップロードした画像をもとに別の画像を生成することも可能です。
画像生成に関しては「Stable Diffusion」のアルゴリズムをベースとし、そこに独自の改良を加えたモデルを採用。2023年3月22日には、AI用のシステムとしてNVIDIAのDGX H100の導入を発表し、完全自社開発のAIモデルに移行する予定であることも明らかにされました。
学習元がネット上で公開されているすべての画像となっているため、ほかの人の著作物を学習に利用しているとの指摘があり、生成画像には「AIトレパク」や「贋作」の疑惑がつきまといます。Anlatanは、生成されたコンテンツを公開するベンダーやプラットフォームにはならないと宣言しており、商用利用に関して否定的な立場をとっています。
・出典:Novel AI(https://novelai.net/)
世界的にユーザーの多いサービスとしては「Stable Diffusion」や「MidJourney」が挙げられます。どちらも2022年に公開されました。
「Stable Diffusion」はミュンヘン大学のグループが開発したもので、コードやウェイトがGitHubで公開されており、オンラインのほかローカルの環境で実行することも可能。これを基礎として、さまざまな画像生成AIモデルが開発されています。AndroidとiOSに対応したモバイルアプリも提供されています。
プロンプトのデータベースやジェネレータもあり、初心者でもとっつきやすいかもしれません。2023年3月現在、バージョン2.1がテスト中です。
NovalAIの項でも述べた通り、Stable Diffusionの学習モデルはネット上にある画像を学習元としているため、著作権侵害の可能性が議論されています。公式サイトでは「オンライン版のStable Diffusionで生成された画像は完全にオープンソース」としていますが、使用に際しての著作権については「複雑で、法の領域によって解釈が異なる」と、商用利用する際にはリスクがあることを示唆しています。
・出典:Stable Diffusion(https://stablediffusionweb.com/)
オープンベータ版として公開されている「MidJourney」は、2023年3月15日に公開されたバージョン5が最新版となっており、過去のバージョンも適用できるようになっています。写真などリアル寄りの画像生成に強みを持っていますが、絵画やイラスト、3D的な画像も生成可能。Discordには「MidJourney Bot」が用意され、対話しながら画像を生成することもできます。
生成された画像は「プロ」プラン加入者を除いて原則公開とし、さらにほかのユーザーによってリミックス可能なコンテンツとして扱われます。また、MidJourneyで公開、もしくはリンクされている素材が著作権を侵害している場合、削除依頼を受け付けるとしています。
ユーザーに対しては、サービスを利用したことで生じるトラブルや損害について、MidJourneyは関与しない立場を明らかにしています。生成した画像を商用利用した場合、トラブルが生じても自己責任で対処してくださいというのとほぼ同義であり、あくまでも個人の範囲で楽しむか、アイデアをまとめるための叩き台として利用するのが無難でしょう。
・出典:MidJourney(https://www.midjourney.com/)
海外でユーザーの多いイラスト系画像生成AIが「NightCafe」。リアル寄りのファンタジー系がデフォルトとなっていますが、日本のアニメ系や3Dゲーム系など、様々なプリセットが用意されています。
画像生成モデルはStable Diffusion、DALL-E 2、Neural Style Transfer、VQGAN+CLIP、CLIP Guided Diffusionといった複数のアルゴリズムを組み合わせたもの。これに独自のReal-ESRGANを加え、強化しているといいます。
生成された画像に対しては「商用利用可能」としていますが、同時に「商標や著作権の所有を主張できること、またそれが第三者の知的財産権を侵害しないことを保証しません」とも宣言されています。
サービス利用規約には、第三者の著作物や知的財産権を侵害するコンテンツは「禁止コンテンツ」と規定されているため、著作権や知的財産権を侵害していない素材を使用して生成した画像のみ、商用利用やNFTとして販売することが可能なようです。
・出典:NightCafe(https://creator.nightcafe.studio/)
有名なAIサービスの一環として提供されているものもあります。対話形言語モデル「ChatGPT」で知られるOpenAIは、GPT-3の改良版をベースに自然言語処理と画像生成モデルを組み合わせた「DALL-E 2」を提供中。写真やCG、絵画など、リアル寄りの画像生成能力が前作「DALL-E」より大きく向上しています。
DALL-E 2の大きな特徴は、生成される画像に制限を加えていること。性的なもの、差別的なもの、憎悪を引き起こすもの、政治的なもの、自傷的なもの、違法行為、事実を歪める欺瞞(フェイク)などについては生成されないような設計となっています。
同時にユーザーに対しては、生成された画像に「AIによって作られた」と明示を求め、同意なしに人物の画像をアップロードすることや、使用権のない画像のアップロードを禁じているほか、公人の画像を生成することを禁じています。
OpenAIでは、DALL-E 2に関する潜在的なリスク分析とその解決策についてを公開しており、その情報は常にアップデートがブログに公開されています。AIを使ってより良い世の中を実現するための研究プロジェクト、としてChatGPTやDALL-E 2などGPTシリーズを位置付けており、悪用されbないための取り組みを続けています。
・出典:DALL-E 2(https://openai.com/product/dall-e-2)
「DALL-E」の簡易版である「DALL-E mini」を基礎に性能向上を果たした「Craiyon」は、無料のサービスとなっていることが最大の魅力。多くのAI画像生成はサブスクリプションサービスとなっていますが、課金や寄付を必要としないので、好きなだけ使い込むことができます。
著作権を侵害するもの、性的なもの、差別的なもの、憎悪を引き起こすもの、政治的なもの、自傷的なもの、違法行為、事実を歪める欺瞞(フェイク)などの生成を禁じているのはDALL-E 2と同様。その上で生成画像を商用利用できるとしていますが、画像には「Craiyon」で生成されたことを示すテキスト、またはロゴを入れることが条件となっています。
・出典:Craiyon(https://www.craiyon.com/)
GoogleやAdobeといった大手でも、画像生成AIを開発中。Googleは「Imagen」という画像生成AIを開発しており、Adobeは「Adobe Firefly」という画像生成AIのベータ版を公開しています。
Imagenは2023年3月末現在、研究を進めていることがアナウンスされているだけで、一般公開はされていません。これは学習元となる画像データ収集に、何の制限もなく収集するLAION-400M(Stable Diffusionの基礎となったデータセット)が一部使われており、著作権侵害の可能性が否定できないこと、また生成される画像に一定のバイアスがかかっていることから、より中立的で攻撃性のないものへ改良中だから、としています。
・出典:Imagen(https://imagen.research.google/)
ベータ版が公開されている「Adobe Firefly」は、学習元となる画像データを自社のストックフォトサービス「Adobe Stock」のほか、オープンライセンス、パブリックドメインのみに限定しており、いわゆる「AIトレパク」を気にせず、正式版となったら商用にも使えるのが特徴。一般的なビットマップ画像のほか、ベクター画像やテクスチャ、動画に3Dモデルの生成も可能となっており、デザインワークに強みを発揮しそうです。
・出典:Adobe Firefly(https://www.adobe.com/sensei/generative-ai/firefly.html)
GPUで知られるNVIDIAも、画像生成AIクラウドサービス「NVIDIA Picasso」を開発中。テキストから画像だけでなく、テキストから動画や3Dモデルまで生成可能としています。
NVIDIA Picassoは開発中ということもあり、利用規約によると生成した画像などのコンテンツは開発用途のために使われ、一般に広く公開することはできない(ダイレクトメッセージなど限られた人への送信は可能)とされています。
・出典:NVIDIA Picasso(https://www.nvidia.com/ja-jp/gpu-cloud/picasso/)
AI画像生成をする際、自分の希望に沿った画像を得るためには「プロンプト」と呼ばれる、画像の条件を記したテキストの書き方が重要になります。
ここにも、簡単にプロンプトを作ることができるサイトがいくつかあります。
MidJourneyやStable Diffusionなどをメインに、効率よくプロンプトを作れるのが、「promptoMANIA」のPrompt Builder。
選択肢を選んでいくことで、自分のイメージに沿った画像を生成するプロンプトが作られていきます。
・出典:Prompt Builder(https://promptomania.com/prompt-builder/)
日本でユーザーの多い「NovelAI」の場合、別に提供されている「NovelAI Documentation」の中に、イメージ通りのプロンプトを書くガイド「Image Generation」が用意されています。
すべて英語なので多少の読解力は必要ですが、記号の活用法など自在にNovelAIを使いこなすヒントが満載です。
・出典:NovelAI Documentation(https://docs.novelai.net/image.html)
AIで生成された画像(モデル)をダウンロードできるサイトもあります。
日本発の「創作オンライン」には、AI画像生成サービスで作られた商用利用可能なイラスト背景素材が揃っています。
・出典:創作オンライン(http://sousaku-online.com/)
AI生成画像を販売しているのが「ArtAI」。キャンバスに出力し額装された「唯一無二のもの」として販売されるほか、購入した作品はダウンロードも可能です。海外ではAIを使って創作するアーティストによる作品が、すでに市場として成り立っているんですね。
・出典:ArtAI(https://www.artaigallery.com/)
NVIDIAでは、研究開発部門が「NVIDIA AI Art Gallery」を開設しています。AI画像生成による作品だけでなく、AIで産業用ロボットを動かし作品を作るアーティストや、AIを使って詩を作る作家なども紹介されており、一口に「AIアート」といっても様々なアプローチがあることを知ることができます。
・出典:NVIDIA AI Art Gallery(https://www.nvidia.com/en-us/research/ai-art-gallery/)
ユーザーがAIで生成したイラストを持ち寄るコミュニティサイトとしては、pixivの「AI」タグが日本ではポピュラーかもしれません。海外では「AIArtists.org」が、世界最大のAIアーティストのコミュニティとうたっています。
・出典:AIArtists.org(https://aiartists.org/)
ほかにも「artzone.ai」では、多くのAIアーティストがオリジナル作品を投稿し、アルバムの形で公開しているほか、AI画像生成も同時に提供。AIアートの底辺拡大にも取り組んでいます。
・出典:artzone.ai(https://www.artzone.ai/)
また、画像生成AIモデルを開発する技術者側のコミュニティもあります。「civitai」では、さまざまな画像生成モデルが開発者から投稿され、それをダウンロードすることが可能。ファイルはおおむね数GB規模となっています。
見本としての生成画像も一緒になっているので、そのモデルがどんな画風に強みがあるのか、推測しやすいのも特徴。投稿者によって商用利用の可否など使用条件が異なるので、ダウンロードする前に確認しておくといいでしょう。
・出典:civital(https://civitai.com/)
- - - - - -
AI画像生成は「AIトレパク」やディープフェイクなど負の側面もありますが、徐々にルールが整備されていきつつあります。まだまだ発展途上ではありますが、ルールを守って活用すると、自分の創作活動へプラスの側面があるかもしれません。
※画像は各サービス公式サイトのスクリーンショット。一部画像のぼかし加工は編集部にて行っています。
(咲村珠樹)