auctores
Menü Zur Startseite
Startseite
Wie viele Finger sind das?

Diese Szene verursacht Albträume. - Bild: auctores

Wie viele Finger sind das?

Eine Glosse über ChatGPT und die Grenzen der künstlichen Intelligenz

Eigentlich wollte unser Autor nur ein Bild für einen Blogpost. ChatGPT entführte ihn stattdessen auf eine absurde Reise durch surreale Bildwelten. Entstanden ist dabei ein heiteres Stück über die Grenzen der Mensch-Maschine-Kommunikation – samt unentwirrbaren Zauberformeln, albtraumhaften Szenen und einem ausgeflippten Hund.

Künstliche Intelligenz ersetze künftig Wissensarbeiter, hieß es noch vor nicht allzu langer Zeit. ChatGPT, so ging die Mär, schreibe Texte, die von Ergüssen aus Federn mit biologischem Hirnhintergrund nicht mehr zu unterscheiden seien. Erste Universitäten kündigten an, fürderhin auf Abschlussarbeiten verzichten zu wollen: Es sei schlicht nicht nachzuweisen ob künstliche Ghostwriter in akademischen Texten ihre Finger im Spiel hätten. Gezählt schienen die Tage der Kreativen in gut bezahlten Jobs.

Macht Dall-E Grafikdesign obsolet?

Doch nicht nur Texter sollten obsolet werden: Mit der Integration der bildgebenden Software Dall-E solle man jederzeit ein passendes Bild generieren können. Eine einfache Textbeschreibung des gewünschten Motivs würde dafür reichen. Den Tod des Grafikdesigns, den wollte mancher schon an den sechs Fingern einer Hand abzählen können.

Ja, richtig gelesen: Sechs Finger. Was die gemein haben mit fünf Tischbeinen, 32 Zähnen im Oberkiefer, einem menschelnden Roboter und einem Hund mit einer absurden Anzahl an Beinen? Nun, sie alle entspringen dem künstlichen künstlerischen Genius von ChatGPTs Dall-E. Mit solch nebensächlichen Details wie der korrekten Anzahl Finger an einer menschlichen Hand hält sich ChatGPT nicht auf. Nein, große Künstler schauen über das Schnöde, Normale hinweg und blicken auf das Wesentliche! Die Revolution der Kunst liegt im Vorstellbaren: Hinweg mit der Konvention! Die Maschine erfindet sich selbst wieder, als surrealistischer Großmeister Jacques GPT.

Er wollte „einfach nur ein Bild“

Blöd nur, wenn ich einfach nur ein Bild brauche, mit dem ich meinen Newsartikel zur elektronischen Rechnungspflicht illustrieren will. Mein Prompt – also die Aufgabe, die ich ChatGPT stelle – ist denkbar simpel: Gestalte mir ein Bild mit dem Thema „Elektronische Rechnung wird ab 2025 Pflicht“ in 1.920 auf 1.165 Pixel, menschlich ansprechend für einen B2B-Online-Artikel zum Thema.

Das Ergebnis war nicht furchtbar: Gut, die Frau auf dem Bild sah aus, wie eine DDR-Stewardess der frühen Achtzigerjahre, die Umgebung war schon arg auf Wolkenkratzer-Großraumbürolevel – aber geschenkt. Ich hätte es als Symbolbild wohl genommen, wenn unter dem magisch schwebenden Tabletcomputer nicht die unentwirrbare Zauberformel „Electtronsiche RECUECH-AB 2025 PÜLLT“ wie ein Menetekel in der Luft geschwebt wäre. Naja. Knapp daneben, nächster Prompt: „Bitte verzichte ganz auf Text im Bild und mache die Menschen auf dem Bild sympathischer. Format und Stimmung bleiben gleich.“

Ein Vater- und Sohn-Gespann, sinister beleuchtet und angeschickert blickend in einer verrauchten Hotellobby mit Outfits zwischen business-casual und Hochzeitsanzug – samt Rose im Revers: Das hätte ich dann doch nicht erwartet. Also, Jacques, bitte zurück zu Mann-Frau-Gespann und Business-vibe.

Doch warum ist das Tablet mit der Rechnung im dritten Versuch geknickt – in meine Richtung? Die können ja gar nicht reinschauen! Und von welchem Licht werden deren Gesichter beleuchtet, wenn der Bildschirm gar nicht auf sie zeigt? Bitte drehe den Bildschirm richtig, achte auf natürliches Licht und lustiger dürfen die beiden wirken.

Ist ChatGPT betrunken?

Der letzte Hinweis war ein Fehler: Denn unser digitaler Künstler dreht im vierten Bild der Serie  vollends in den Faschingsmodus. Der Bildschirm ist jetzt nicht mehr geknickt, aber er zeigt vollkommen von den beiden Gestalten weg – die offensichtlich irgendetwas auf der Rückseite des Tablets so belustigt, dass sie in unkontrollierbares Lachen ausbrechen, die Gesichter zu diabolischen Fratzen verzogen.

Doch die künstlerische Freiheit hört bei Dall-E nicht mit schlichtem Ignorieren meiner Anweisungen auf, nein! Die Frau müsste, grob nachgezählt, auch die Ausstattung eines gesamten menschlichen Gebisses in ihrem Oberkiefer tragen. Vielleicht lacht sie deshalb über ihr Spiegelbild, als ob sie schwer getrunken hätte? Ich jedenfalls werde noch nächtelang schlecht davon träumen. Hilfe! Ich wollte doch nur ein Bild für meinen Artikel!

Kann der Bot zählen?

Neustart. Wir probieren es ganz anders, Herr Künstler: Bitte generiere ein sympathisches, menschliches Bild mit Personen, die aussehen wie Buchhalter*innen. Meinen Artikel gebe ich als zusätzlichen Input ein. Das führt zu einer Konferenzszene, die entfernt an eine biblische Abendmahldarstellung erinnert. Statt Heiligenscheinen schweben über den Business-Aposteln am fünfbeinigen Konferenztisch die Worte „Maniatory Electroniic Invucess“. Ja, Dall-E, fast. Also gehen wir zurück zu zwei Personen.

Die sehen auf Bild sechs dafür nun richtig sympathisch und einigermaßen normal aus, halten die Tablets richtig herum, wirken konzentriert. Ja, das kann man nehmen – wollte ich fast sagen. Warum hat die Frau sechs Finger? ChatGPT, wie viele Finger hat ein Mensch? „Ein Mensch hat normalerweise 20 Finger und Zehen – zehn Finger an den Händen und zehn Zehen an den Füßen“, antwortet mir der Bot wie ein entlarvter Schulbub. Ich glaube, der Schelm möchte mit mir einen Schabernack treiben. „Normalerweise“ schreibt er, soso. Also bitte jetzt: Mach die beiden noch etwas menschlicher und mit der korrekten Anzahl an Fingern.

Kapitulation und Forscherdrang

Nun, bei der Frau stimmt die Anzahl der Finger auf dem siebten Bild, aber der Mann hat sechs davon. Unter „menschlicher“ versteht der Künstler, dass die beiden nun aussehen wie Wachsfiguren mit beginnender Gelbsucht. Dabei wirken sie solcherart entrückt, dass man sie eher auf dem Prospekt einer Weltuntergangssekte vermuten könnte, als im Titelbild zu einem Blogpost über E-Rechnungen. Bitte: Lass die Gestalten doch menschlicher wirken. Diese Bitte führt schließlich zu Roboterhänden mit sechs Fingern. Also sind Roboterhände für ChatGPT „menschlicher“? Das macht mir Sorgen.

Das Vorhaben langsam aufgebend, will ich zumindest Erkenntnis gewinnen: Wie deutlich muss man eigentlich vorgeben, was man will, damit das Programm eine sinnvolle Darstellung ausspuckt? Also lasse ich mir im ultimativen Test eine heilige Handgranate schaffen. In der Szene aus dem Film „Die Ritter der Kokosnuss“ erklärt eine Bibelstelle elend lang, dass man vor dem Werfen der heiligen Handgranate von Antiochia bis drei zählen müsse. „Drei ist die Nummer, bis zu der man zählen soll, nicht vier.“

Tatsächlich schafft das Programm nach Eingabe des englischen Originaltextes ins Chatfenster eine sinnvolle Darstellung. Aber heißt das, man muss für jeden Prompt, wie in der Filmszene, die Aufgabe mindestens sechs Mal wiederholen und dabei die Fehler – hier „zwei“ und „vier“ – direkt ausschließen? Oh mei. Also Grafikdesigner*innen brauchen vor diesem Programm so schnell keine Angst zu haben. Auch irgendwie beruhigend.

Ein Hund, der hat vier Beiner

Am Ende, so finde ich, habe ich es mir verdient, mir noch einen Scherz zu erlauben – damit ich zumindest irgendwie auf meine Kosten komme. Ich bitte den Chatbot, mir ein Bild zu generieren, das auf folgendem Zitat des niederbayerischen Liedermachers Fredl Fesl beruht: „Ein Hund hat vier Beiner, an jeder Ecken einer. Fünf Beiner hät, ausflippen tät!“ Der Chatbot mochte wohl die Vorstellung eines ausflippenden Hundes so sehr, dass er ihm gar 17 „Beiner“ spendierte. Naja, ChatGPT. Nah genug für dich, man ist ja mittlerweile mit wenig zufrieden – oder wie wir in Bayern sagen: „Is scho recht!“

« zurück