Fotografie News - Landesverband Berlin, Brandenburg, Mecklenburg-Vorpommern

  • 15.06.2022 Hintergrundwissen

    Eine Beschreibung wird zum Bild…..

    …. und die Zukunft der Fotografie






    Bilder können ihren Sinne und ihre Bedeutung im Moment der Betrachtung übermitteln. Eine sprachunabhängige Kommunikation erfolgt häufig über Bilder. Lange bevor wir uns der sprachbasierten Bildinterpretation zuwenden, hat das Bild seine Wirkung entfaltet. Künstlerisch orientierte Fotograf:innen legen Wert darauf, dass ihre Bilder etwas zeigen, dass sich mit Hilfe von Sprache nicht vermitteln läßt. Es bleibe etwas Unergründliches oder Geheimnisvolles übrig, dass man nicht mit Worten beschreiben kann. Ein Bild läßt sich nicht vollständig mit Worten erfassen. Es hat seine eigene Sprache. Im Umkehrschluss müßte das bedeuten, dass jede noch so ausgefeilte Bildbeschreibung nicht eins zu eins in ein Bild übersetzt werden kann. Klingt überzeugend oder?

    Vor etwas über einem Jahr hat das auf künstliche Intelligenz spezialisierte Forschungslabor OpenAI die erste Version von DALL-E gestartet. Es handelt sich um ein neuronales Netz, dass einfache Textbeschreibungen in Bilder übersetzt.

    Wer steht hinter OpenAI? Ihr werdet es schon ahnen. Ohne auf die Details der Verflechtungen einzugehen, sind die Namen Microsoft und der unvermeidliche Elon Musk zu nennen, die mit erheblichen Beträgen am Start sind. Aber das nur am Rande.

    Jetzt wurde mit DALL-E 2 die zweite Generation der KI vorgestellt, die nicht nur überzeugendere Bilder generiert und editiert, sondern auch mit einer vierfach höheren Auflösung (1.024 x 1.024) als bisher.

    Und erstmals können Bilder nicht nur generiert, sondern auch gezielt per Text editiert werden - auch können einzelne Bildelemente jetzt sowohl zum Bild hinzugefügt als auch entfernt werden.

    DALL-E 2 wurde mit Hilfe einer Vielzahl von Bilder trainiert. Das Programm hat den Zusammenhang zwischen Bild und Text gelernt. Damit kann das Programm eine große Bandbreite von Inhalten verarbeiten, die eingegeben werden. Es geht nicht mehr nur um Objekte, sondern auch um Relationen zwischen Objekten und und um Handlungen, die in Bilder übersetzt werden.

    Die Beschreibung „Kauender Affe bedient Computer“ wird in ein Bild übersetzt. Das Programm kann fotorealistische Bilder ebenso wie Cartoons erzeugen. Der Bildstil ist bestimmbar. Auch wenn es immer noch Bildfehler wie Verzerrungen gibt, sind die Ergebnisse von DALL-E 2 erstaunlich. Ein auf einer viktorianischen Parkbank sitzender Haase ist für die KI keine größeres Problem.

    Die Auswirkungen solcher Programme auf das Arbeitsleben beispielsweise von Illustratoren oder gar auf künstlerisch orientierte Fotograf:innen sind kaum abzusehen. Wenn die Bildfehler ausgemerzt sind, wer soll dann zwischen KI-Foto und menschengemachtem Foto unterscheiden? Menschengemacht ist das KI-Foto in einem gewissen Sinne auch. Allerdings wird nicht mehr der Auslöser gedrückt. Die Bildbeschreibung wird eingeben und das Bild erscheint. Tröstlich stimmt mich die eingangs getroffene Feststellung, dass Bilder nicht mit Worten vollständig erfasst werden können. Aber vielleicht wird diese Kluft irgendwann auch überwunden und das, was die Künstler:innen ausdrücken wollen, vollständig in Worte fassbar und mit Hilfe von KI in ein Bild übersetzbar.

    Es gibt viele offene Fragen. Wie sieht es mit der Genese beweglicher Bilder mit Hilfe von KI aus? Ist das der nächste Entwicklungsschritt? Sind Assistenzprogramme wie Siri denkbar, die komplexere Aufgaben lösen? Über den Missbrauch solcher Programme muss früh genug nachgedacht werden, was aber wohl nicht passieren wird. Vermute ich mal.


    Christoph Linzbach