Birdsinc

思考のメモ コンピューティショナルフォトグラフィについて

2026-02-11||鳥原 学

最近考えていることのメモとして

計算される視覚

コンピューティショナル・フォトグラフィとは、コンピュータヴィジョンの原理を画像処理へと応用した、撮影と同時に遂行される「Photoshop」のカメラへの実装ということができる。コンピュータヴィジョンは、人工知能研究者のデヴィッド・マーが指摘した、人間の目が「視覚的な形態は、通常、知識に依存しない(knowledge-free)手法を用いて画像から抽出できる」という能力に基づく。私たちは対象が何であるかという「意味」を事前に判別することなく、輝度の勾配や線の整列といった物理的なデータから「形態の記述」を演算しているのである。

この事実は、たとえば抽象画の鑑賞プロセスにおいて顕著に現れる。観る者は画面にある線、輝度域、量、密度といった、それ自体では意味を持たない情報の連なりを脳内で整列させ、構造化を試みる。しかし、対象が既成の意味へと収束することを拒絶するため、知性と心理の働きによるその計算操作を永続的に繰り返すことになる。抽象画の印象がつねに動いて見えるのは、この未完の計算が引き起こす心理的現象と言えるだろう。

ジークフリート・クラカウアーが『映画の原理』で説いた、写真の「無限」もこの地平にある。写真は、見えない部分を経験則で補完させるだけでなく、コードを欠いた描写であるがゆえに、観る者に抽象画と同様の計算を反復させる。これらのことは視覚情報が常に意味に先行していることを示唆する。

コンピュータヴィジョンは、この人間の視覚システムをコンピュータに模倣させることで誕生し、そしてコンピューティショナル・フォトグラフィが実現させた。そのアルゴリズムの急速な進化によって現代のカメラは、情報から構造を見出すという視覚の生理的な快楽を先回りして提供するようになった。こうして先進的なコンピュータヴィジョンを実装したデジタルカメラは、単なる記録機を超えた「形態の発見器」としての進化を続けている。

例えばアンリ・カルティエ=ブレッソンが提唱した「決定的瞬間」の美学――「出来事の意味」と、それを支える「フォルムの厳密な構造」の同時認識――もまた自動化されうるのである。

人工知能の機能は、クロード・シャノンの情報理論に従い、冗長性から不確実性やノイズを排除することで、統計的な最適解へと自動的に収束させることである。それは正確な伝達と引き換えに、誤読を含めた読みの多様性を失わせるだろう。

コンピューティショナル・フォトグラフィを写真表現のために使うなら、人間側にはそれに圧倒されてしまわない知性と心理の働きが要求されるだろう。未完の計算という楽しみが誰かに奪われないために。