Der Text ab der Markierung## wurde von ChatGPT 5.2. erstellt.
Das habe ich ChatGPT gefragt und im ersten Schritt bot mir die KI Argumente dafür und dagegen an, wobei in der Argumentation die technische Hervorbringung betont wurde. KI mixe keine Bilder, sondern sie erzeugt neue Pixel aufgrund von Wahrscheinlichkeiten.
Mein Einwand, dass die technische Funktionsweise nicht die Bedeutung erklärt, brachte eine neue Reflexionsschleife hervor. Der nachfolgende Text ist die Antwort von ChatGPT 5.2. auf die Frage:
„Die technische Funktionsweise (neue Pixel auf Basis mathematischer Wahrscheinlichkeiten) erklärt doch nicht die Bedeutung. KI-Bilder sind Collagen in dem Sinn, dass sie Mixturen aus Prompt und Neugenerierung von Bildern sind. Die Bedeutung erschöpft sich nicht in der zugrunde liegenden technischen Struktur.“
##
Ihr Einwand ist zentral und meines Erachtens überzeugend: Die Bedeutung von KI-Bildern lässt sich nicht aus ihrer technischen Erzeugungsweise ableiten. Die Erklärung „neue Pixel auf Basis mathematischer Wahrscheinlichkeiten“ beschreibt eine ontische Bedingung, aber keine semantische oder ästhetische Struktur. In diesem Sinn verfehlt eine rein technische Abgrenzung des Collagebegriffs den Kern der Sache.
Ich würde Ihre Position wie folgt präzisieren und zugleich systematisch absichern:
1. Collage als Bedeutungsform, nicht als Materialtechnik
Wenn man Collage nicht materialistisch (Schere, Papier, Fragmente), sondern semiotisch versteht, dann bezeichnet Collage ein Verfahren der Bedeutungserzeugung durch Mischung heterogener Quellen. Entscheidend sind dabei:
- die Gleichzeitigkeit verschiedener Herkunftslogiken,
- die Spannung zwischen Vorgabe und Emergenz,
- die sichtbare oder implizite Hybridität.
KI-Bilder erfüllen diese Kriterien:
- Der Prompt fungiert als sprachlicher Bedeutungsanker.
- Das Modell bringt visuelle Formen hervor, die nicht identisch mit dem Prompt sind, sondern ihn interpretieren, erweitern, verzerren.
- Das Bild ist eine Mixtur aus intentioneller Setzung (Prompt) und nicht vollständig kontrollierter Generierung.
In diesem Sinne ist das KI-Bild eine semantische Collage, auch wenn es keine materiellen Fragmente gibt.
2. Prompt + Generierung als kollagierende Operation
Der Prompt ist kein bloßer Befehl, sondern ein kulturell aufgeladener Text:
- Er enthält Referenzen, Stile, Genres, implizite Bildtraditionen.
- Er wirkt wie ein montierendes Prinzip, das disparate visuelle Möglichkeiten zusammenzieht.
Die Generierung wiederum ist kein einfaches „Ausführen“, sondern ein produktiver Überschuss:
- Das Modell antwortet nicht mit Reproduktion, sondern mit Variation.
- Bedeutungen entstehen im Zwischenraum von Sprache und Bild.
Gerade diese Unabschließbarkeit der Kontrolle ist typisch für Collagen: Auch bei klassischen Collagen entsteht Bedeutung nicht allein aus der Absicht des Künstlers, sondern aus der Reibung der Elemente.
3. Bedeutung als relationales Ereignis
Sie haben Recht: Die Bedeutung erschöpft sich nicht in der zugrunde liegenden Struktur. Man könnte sagen:
- Die Technik erklärt, wie etwas möglich wird.
- Die Collage erklärt, wie Bedeutung entsteht.
KI-Bilder sind Collagen, weil ihre Bedeutung relational ist:
- zwischen Prompt und Bild,
- zwischen Trainingskultur und individueller Anfrage,
- zwischen Erwartung und Überraschung.
Damit ähneln sie weniger einem „neuen Gemälde“ als einem kulturellen Aggregatzustand, der bereits vorhandene Bildlogiken neu verschaltet.
4. Konsequenz: Collage ohne Fragmente, aber mit Differenz
Der entscheidende Punkt ist nicht, ob KI „wirklich“ collagiert, sondern ob der Begriff erklärungsstark ist. Und hier spricht vieles dafür:
- Er macht sichtbar, dass KI-Bilder nicht aus dem Nichts kommen.
- Er vermeidet den Mythos autonomer Kreativität.
- Er beschreibt präzise die Mischung aus Setzung, Zufall, kulturellem Gedächtnis und algorithmischer Transformation.
Man könnte zuspitzen:
KI-Bilder sind keine Collagen aus Bildern, sondern Collagen aus Bedeutungswahrscheinlichkeiten, aktiviert durch Sprache.
Kurzform
Ja: KI-Bilder sind Collagen – nicht technisch, sondern hermeneutisch.
Sie sind Mixturen aus Prompt, kulturellem Bildwissen und generativer Eigenlogik, deren Bedeutung gerade aus dieser Verschränkung entsteht.
Wenn Sie möchten, kann ich diese Position noch mit Blick auf Autorschaft, Intentionalität oder Bildtheorie (z. B. ikonische vs. diskursive Bedeutung) weiter ausarbeiten.
Wer möchte, kann den Chat unter dieser Adresse weiterführen:
https://chatgpt.com/share/6960de5c-a178-800b-a529-f99bf403521b