Kyle Wiggers@kyle_l_wiggers / 12:00 AM GMT+7•October 20, 2023
Image Credits: Bryce Durbin / TechCrunch
OpenAIは、画像がOpenAIの生成AIアートモデルであるDALL-E 3で作成されたかどうかを判断できるツールをいつリリースするかについて「かなり広範囲に議論され、議論されてきた」。 しかし、このスタートアップがすぐに決断を下す可能性は低い。
これは、ポリシーと安全性を専門とする OpenAI 研究者である Sandhini Agarwal 氏によるもので、彼は今週 TechCrunch の電話インタビューに応じた。 彼女は、分類器の精度は (少なくとも彼女の推定では) 「非常に優れている」ものの、それでも OpenAI の品質しきい値を満たしていないと述べました。
「問題は、やや信頼性の低いツールを考え出すことです。そのツールが下す決定は、作品がアーティストによって描かれたと見なされるか、それとも現実的でなく誤解を招くかなど、写真に大きな影響を与える可能性があるからです。」
OpenAI がこのツールで目標とする精度は非常に高いようです。 OpenAIの最高技術責任者であるミラ・ムラティ氏は、今週ウォール・ストリート・ジャーナルのTech Liveカンファレンスで、この分類器は、改変されていない写真がDALL-E 3で作成されたかどうかを判断する上で「99%」信頼できると述べた。 おそらく目標は 100% です。 アガルワルは言わないだろう。
TechCrunch と共有された OpenAI ブログ投稿の草稿から、次の興味深い情報が明らかになりました。
「[分類器] は、画像がトリミング、サイズ変更、JPEG 圧縮などの一般的な種類の変更を受けた場合、または画像からテキストやセクションが切り取られた場合でも、95% 以上の精度を保ちます。現実は、画像の小さな部分に重ね合わされます。生成された画像。
OpenAI が消極的なのは、OpenAI のモデルだけでなく他のモデルからも AI が生成したテキストを検出するように設計された、以前に公開されていた分類器をめぐる論争に関連している可能性があります。 OpenAIは、広く批判されている「精度の低さ」を理由に、AIで書かれたテキスト検出器を廃止した。
アガルワル氏は、OpenAI が AI 生成画像を正確に構成するものは何かという哲学的問題にも焦点を当てていることをほのめかしています。 当然、DALL-E 3 によってゼロから作成されたアートワークが対象となります。 しかし、数回の編集を経て他の画像と結合され、いくつかの後処理フィルターを通過した DALL-E 3 の画像はどうでしょうか? あまり明確ではありません。
「その時点で、その画像はAIが生成したものと考えるべきでしょうか?」 アガルワル氏は語った。 「現在、私たちはこの問題に取り組もうとしているところです。そのような[分類]ツールによって大きな影響を受けるであろうアーティストや人々の意見をぜひ聞きたいと思っています。」
AI ディープフェイクが急増する中、OpenAI だけでなく、いくつかの組織が合成メディアの透かしと検出技術を研究しています。
DeepMind は最近、人間の目には知覚できないが、専用の検出器によって検出できる方法で AI 生成画像をマークするための仕様である SynthID を提案しました。 2020年に立ち上げられたフランスのスタートアップImatagは、SynthIDと同様に、画像のサイズ変更、トリミング、編集、圧縮の影響を受けないと主張する透かしツールを提供している。 ただし、別の企業である Steg.AI は、AI モデルを使用して、サイズ変更可能な透かしやその他の編集を適用しています。
問題は、業界が依然として単一の検出または透かし標準に関して統一されていないことです。 たとえあったとしても、透かし、さらに言えば検出器が破られないという保証はありません。
私は Agarwal に、OpenAI の画像分類器が OpenAI 以外の生成ツールで作成された画像の検出をサポートしているかどうか尋ねました。 彼女はそれにコミットしなかったが、今日存在する画像分類ツールの受け入れ次第では、これは OpenAI が検討する可能性のある手段であると述べた。
「現時点で(分類器が)DALL-E 3 に固有である理由の 1 つは、技術的には問題の解決がはるかに簡単だからです」と Agarwal 氏は述べています。 「[一般的な検出器は] 私たちが今取り組んでいることではありません…しかし、[分類器が] どこに行くかによっては、決してやらないとは言いません。」