Welche Bilder werden generiert der gleiche Prompt in unterschiedlichen Systemen verwendet wird?

Werkzeuge

Midjourney

Prozess

01 Wahl der Stile
02 Einfügen des Stils in den Prompt und teils leichte Anpassungen
03 Export & Upscale

Prompt & Settings

letter D in the style of [...] Midjourney Settings: --q 1 --s 500

Learnings

Ein Tool wie Midjourney kann schon mit sehr einfachen Prompts beeindruckende Ergebnisse liefern. Dabei hat man leider keine Kontrolle über die Form des Buchstabens. Auch die Stile der Varianten sind meist sehr willkürlich. Zu guten Ergebnisse kommt man hier vor allem durch das Finden der richtigen Keywords. Hier sind oft Synonyme für Begriffe und generelles Hintergrundwissen zum gewünschten Look sowie der Funktionsweise von Midjourney gefordert. Unter dem Ausdruck „pixel art“ beispielsweise sind keine brauchbaren Ergebnisse entstanden, da der Algorithmus jedes Wort einzeln durchgeht. Schreibt man „pixelart“ zusammen, liefert es direkt präzisere Ergebnisse. Das Zusatz Keyword „8-bit“ verstärkt den gewünschten Look nochmals. Das Experiment bei gleichem Motiv mehrere Stile durchzuspielen offenbart außerdem einen sehr deutlichen Bias des Midjourney Models: 3D Renderings. Viele der Buchstaben hatten 3D-artige Schattierungen oder eine dreidimensionale Perspektive. „Flat Design“ ohne jegliche Tiefe ist auch mit entsprechenden Keywords schwer zu erzeugen. Auch die Unterscheidung zwischen den Buchstaben bekommt Midjourney nicht zuverlässig hin. Bei Buchstaben mit ähnlicher Struktur wie B und D, M und N oder E und F, wirft es häufig die ähnlichen Buchstaben zusammen oder bildet kryptische Mischformen.

back