AI がフレーズを画像に変換
AI ベースのテキストから画像へのアート生成ツールに、鮮やかな黄色のベンチでウォール ストリート ジャーナルに夢中になっている人型ロボットの画像を作成するというタスクが割り当てられていたことがありました。このコンセプトは魅力的ですが、利用可能な無数のロボット画像のうち、本物は 1 つだけである可能性があることを思い出させてくれます。 。これらのロボット フィギュアの大部分は、テキストから画像へのジェネレーター、特に OpenAI の CLIP などのツールを使用する人工知能によって誕生しました。このような画像を作成したい人は、フレーズを入力するだけで、それに応じて画像が形成されます。
キーポイント:
- AI ツールには、テキストから画像を生成する機能があります。
- ロボット画像の大部分は、本物ではなく AI によって捏造されたものです。
リアル vs. AI: 比較分析
AI による写真生成が人間の能力と競合できるかどうかを評価することで、AI による写真生成の限界をテストするという課題が考案されました。人間の参加者は本物の写真家で、着用に1時間かかる複雑で細心の注意を払って作られたロボットスーツを着ていました。
AI 画像生成プロセスを解読する
画像生成メカニズムを理解するために、Dolly 2 や Dream Studio などのプラットフォームには、ユーザーがフレーズを挿入するための単純なテキスト ボックスが用意されています。これらの AI プラットフォームは、提供されたテキストを解釈し、独自の画像に変換します。
- Dolly 2 や Dream Studio などの AI ツールは、テキスト入力を視覚的に創造的な画像に変形させます。
AI の学習面
しかし、AI にとって学習とは、単にいくつかの画像を記憶することと同じではありません。 ImageNet チャレンジと同様に、何十億ものラベル付き画像をふるいにかけなければなりませんでした。この演習は、AI がさまざまな形状やオブジェクトの種類をさらに区別し、異なるオブジェクト間の関係を識別するのに役立ちました。
キーポイント:
- AI は、数十億枚のラベル付き画像を調べて、さまざまな形状、オブジェクトの種類、さまざまなオブジェクト間の接続を識別することで知識を獲得します。
AI の芸術的スキルを振り返る
基本的なイメージの作成は、これらのプログラムの機能の 1 つの側面にすぎません。彼らはさまざまなアートや写真のスタイルを理解することに熟達しているため、ユーザーは幅広いスタイルを試すことができ、中世の絵画として描かれたオフィスのプリンターの修理や、アンディ ウォーホル風のサングラスをかけたウサギの類型絵画などの創作につながります。
リアルな画像を作成する際の障害
しかし、リアルな写真の生成はこれらのシステムにとって大きな課題であり、最終製品がぼやけたり、位置がずれたりすることがよくあります。
AI 画像生成の悪用の可能性
このようなツールの潜在的に有害な側面を無視しないことが重要です。これらは、暴力的または政治的なイメージを生み出すために操作的に使用される可能性があります。これは、AI が生成したコンテンツの破壊的な目的での使用を阻止する改訂された技術ポリシーの要件を強調しています。
- AI ツールを操作して、暴力的または政治的な画像を生成する可能性があります。
- AI によって生成されたコンテンツの悪用を阻止するには、技術ポリシーを更新することが緊急の要件となります。
AI の悪用に対抗する
本物の画像と AI が生成した画像を区別するという作業は、ますます大きな課題となっています。 AI が生成した画像の承認を奨励したり、透かし入りの画像を宣伝したりする Open AI のポリシーなどの措置が開始されています。
結論: AI アート ツールの欠点と進歩
最終的に、AI アート ツールは目覚ましい進歩を遂げましたが、完璧ではありません。リアルな画像を作成するには、プロの写真家と小道具が必要になる場合があります。それでも、プレゼンテーションや Web サイト用のインスタント ビジュアルやイラストの場合は、AI ツールが優れています。これらの AI アート ツールがどれほど洗練されたものを達成したとしても、その創作を推進するコンセプトを正当化することは決してできないということを心に留めておくことが極めて重要です。
キーポイント:
- AI は大幅な進歩を遂げましたが、特にリアルな画像の作成においては限界に直面し続けています。
- AI ツールは、プレゼンテーションやウェブサイト用のビジュアルやイラストを迅速に生成することに優れています。