ChatGPT Plusで生成した画像を、Photoshopのように部分編集できる!
使って感じた、AIアートの課題
新しい編集ツールを使ってさまざまなトリックを試してみました。 犬を牧草地に置いて色や位置を変更することはうまくいきましたが、城壁の上に立つ巨人のサイズを縮小することはあまりうまくいきませんでした。巨人は、城壁の部品のぼやけた中で消えてしまいました。これは、AIが巨人の周りをうまく塗りつぶそうとしていたものの、うまくいかなかったことを示しています。 「サイバーパンクの舞台で車を追加」するように要求しましたが、車は表示されませんでした。別の城のシーンでは、飛んでいる竜を反対方向に向くよう向きを変え、竜の色を緑から赤に変更し、口から炎を出すように要求しました。数秒後、ChatGPTは竜を完全に取り除きました。 この機能はまだ新しく、OpenAIはまだ人間の画像編集に取って代われるとは主張していません。なぜなら、明らかにそれはできないからです。 とはいえ、今後この機能は改善されていくでしょう。私が紹介したような間違いは、特定の種類のAIが生成するアートにはどんな課題が発生しやすいのかを見つけるのに役立ちます。 DALL-Eやそのようなモデルが非常に得意とするのは、訓練された何百万という数の城のデータに基づいて、良い近似値を提供するためのピクセルの配置を知っていることです。 しかし、AIは幾何学や物理空間を理解していないため、城が何なのかを知りません。私がAIにつくらせた城には、どこからともなく砲台が突き出しています。建物や家具、または適切にレンダリングされていないオブジェクトを含む多くのAI生成アートに、このような課題が見られます。 このような課題の根本にあるのは、これらのAIモデルは「何を表示しているのか」をまだ理解していないということ。 これが、OpenAI Soraの多くの動画で人がどこかに消える理由です。AIは非常に巧みにピクセルを配置しているのであって、人を追跡しているわけではないのです。 AIは異なる人種のカップルの画像を生成するのに苦労するという記事を読んだことがあるかもしれません。これは画像トレーニングデータに基づくと、同じ人種のカップルは、異なる人種のカップルと比べより一般的であるためです。 最近注目されているもう1つの興味深い点は、これらのAIアート生成ツールが白い背景を作成できないということです。 AIアート生成ツールは多くの面で非常に賢いツールですが、私たちが思考する方法や人間のアーティストが理解する方法とは異なり、「考えている」わけではありません。 そのため、AIアート生成ツールを使用する際にはこの点を考慮することが重要です。 Source: X, Wikipedia, The Verge, PetaPixel
真栄田若菜/OCiETe