カメラが生成写真に負ける理由(1)

ドイツの写真家ボリス・エルダグセン氏は、人工知能(AI)が生成した写真で、ソニーワールドフォトグラフィーアワードに応募して、3月に、オープンコンペティションのクリエイティブ部門で受賞しています。

 

エルダグセン氏は、受賞を辞退しています。

 

カメラが生成写真に勝てるか、考えてみます。

 

Beingに、「梅とメジロ(Plum flower and Zosterops japonicus)」で、イメージを作成させた例を示します。

 

Beiingの画像生成には、日本語は通じないので、英語で指示を与えます。

 

写真1



 

 

 

これを絵とみるか、写真と見るかは判断が分かれますが、ここでは、写真として評価します。

 

写真として評価すると、現実には、あり得ないライティングとボケの表現になっています。

 

写真1のメジロには、下から上に向けて光が当たっていますが、メジロの顔は影になっていません。スタジオで多灯のライティングをすれば、写真1に近いライティングは可能ですが、屋外では、不可能です。露光の部分的な調整で、問題点を弱めることができますが、それでは、写真1には、勝てません。

 

ボケは主題のメジロにはかからずに、他にかける必要があります。

 

梅の花は、メジロよりは、解像度が低く、背景よりは、解像度が高い必要があります。

 

右下の白い花は白飛びしていますが、その点を除けば、ボケ量の調整は見事です。

物理的には、カメラのセンサーから等距離にある物体のボケ量は同一になります。

しかし、それでは、写真が平板に見えるので、RAW現像時に、主題とそれ以外に分けて、マスクを使って解像度の調整をします。これはかなりの手間になります。

 

この手間のコストを避けるプロのカメラマンは、RAW現像はせずに、カメラの作成したJpegを使います。その場合には、カメラのセンサーから等距離にある物体のボケ量は同一になります。

 

つまり、原理的に、Jpegでは、生成写真に勝てないことがわかります。

 

Beingの画像生成には、素材を組合せるだけでなく、見栄えをよくするアルゴリズムが入っています。

 

写真では、メジロを浮き上がらせるために、メジロに近い梅の花はボケています。

一方、左の大きな梅の花は、ボケていません。

 

カメラでは、このようなボケの写真をとることは不可能です。

 

写真2の場合には、捏造がわかりますが、捏造がわからない場合もあります。

 

ライティングは、捏造ですが、追い焼きでも類似の効果を出せますので、許容範囲とも言えます。

 

捏造がわからない場合には、生成写真の方が、カメラの写真より、インパクトが強くなります。

 

現時点の生成写真は、こうした明らかな捏造を回避していませんが、生成AIは、大量の生成写真を作りだせるので、人間が適切に選別すれば、カメラの写真より、インパクトが強く、捏造が目立たない写真を抽出できます。

 

写真2





エルダグセン氏の写真が受賞したことは、まぐれではなく、ライティングとボケの性能がカメラより高いので、当然と考えることも出来ます。

 

料理本の写真は、見栄えがよい捏造写真です。

 

氷の代りに、アクリルキューブをつかっています。

 

生成写真であれば、そんな面倒なことはせずに、氷の画像を、アクリルキューブの画像に入れ替えてくれます。

 

写真が、見栄えの悪いリアィティを選択できれば別ですが、現状では、カメラの写真は、生成写真に原理的に勝てないと思われます。