Bild-KI: Was die Bildgeneratoren können und wie sie funktionieren

KI-Bildgeneratoren erstellen Bilder, die täuschend echt aussehen. Dazu müssen Sie der KI einen Textbefehl erteilen, den „Prompt“. Hier erfahren Sie, wie Sie zu optimalen Ergebnissen kommen.

Abstrakte geometrische Figuren die durch Punkte verbunden sind
Mit künstlicher Intelligenz ist es möglich, Bilder zu erstellen. Foto AdobeStock

Künstliche Intelligenz (KI) übernimmt in der kreativen Arbeit eine immer größere Rolle. Während textgenerierende Tools wie „ChatGPT“ das Schreiben erleichtern und Programme wie „DeepL“ Texte automatisch übersetzen, kommen KI-Bildgeneratoren oft in der Werbung, in der Entwicklung von Videospielen, im Produktdesign oder in der Medienbranche zum Einsatz. Digital arbeitende Kreative nutzen KI-Programme, um schnell und einfach neue Bilder zu erstellen beziehungsweise zu bearbeiten oder um sich zu neuen Ideen inspirieren zu lassen.

Wer Bilder bearbeitet und Grafiken erstellt, musste bis vor einigen Jahren den Umgang mit Programmen wie Adobe Photoshop oder InDesign beherrschen. Das ist nun einfacher geworden. Wer kein professioneller Grafiker oder Illustrator ist, kann sich heute sogar komplett auf KI-Tools verlassen. Mitunter lassen sich dadurch Bilder generieren, die von realen Fotografien kaum zu unterscheiden sind.

Doch es gibt auch Regeln, die zu beachten sind. So kommt es bei den KI-Programmen auf den richtigen „Prompt“ an, also auf die genaue Formulierung des Befehls, wonach die KI das gewünschte Bild erstellt. Dieser Beitrag bietet Ihnen einen Überblick über die wichtigsten Programme und zeigt, wie Sie in wenigen Schritten zum gewünschten Bild kommen.

Wie funktioniert die Bild-KI?

Den KI-Bildgeneratoren liegt eine „generative KI“ zugrunde, also ein KI-Programm, das aufgrund eines sogenannten Deep-Learning-Modells (auch als „maschinelles Lernen“ bekannt) Inhalte erzeugt. Deep Learning bedeutet in diesem Zusammenhang, dass die KI mit jedem erstellten Bild etwas Neues dazulernt und die Ergebnisse daher immer besser und realistischer werden. Aber wie machen die Programme das?

KI-Bildgeneratoren funktionieren auf Basis verschiedenster Algorithmen. Eine weit verbreitete Methode sind dabei die „Generative Adversarial Networks“ (GANs): Bei einem solchen KI-System stehen sich zwei neuronale Netze gegenüber, der Generator und der Diskriminator. Der Generator erstellt die Bilder und der Diskriminator beurteilt, ob diese echt oder künstlich aussehen. Durch die Reaktion des Diskriminators lernt der Generator schrittweise, realistischere Bilder zu erzeugen, während der Diskriminator seine Fertigkeiten im Erkennen von Nachahmungen weiterentwickelt.

Eine Sache haben alle KI-Modelle gemeinsam: Sie werden durch das Studium von Millionen von Daten trainiert. Die KI erstellt Grafiken, Fotos und Zeichnungen also nicht aus dem Nichts, sondern greift auf bestimmte Muster zurück, die sie sich bei der Durchsicht der Daten angeeignet hat.

Hinweis

Wie es beim Thema KI um die Cybersicherheit steht, erklärt der Beitrag „Künstliche Intelligenz im Spannungsfeld der IT-Sicherheit“. Für den sicheren Umgang mit ChatGPT bieten die Beiträge „ChatGPT nun auch auf Snapchat“ und „ChatGPT in der Schule – wie damit umgehen?“ nützliche Informationen.

Welche KI-Bild-Tools gibt es und wozu braucht man sie?

Der wichtigste Unterschied zu herkömmlichen Grafikprogrammen besteht darin, dass Nutzerinnen und Nutzer keine komplexe Software mit unzähligen Werkzeugen und Optionen der digitalen Bildbearbeitung beherrschen müssen. Alle technischen Handgriffe übernimmt nun automatisch die KI, während Sie nichts weiter tun müssen, als der KI eine Anleitung – in der Regel in Form eines kurzen Textes – zu geben, wie das gewünschte Bild aussehen soll. Man spricht deshalb auch von „Text-zu-Bild-Generatoren“.

Die Funktionen – und natürlich auch die Qualität – der einzelnen KI-Bild-Tools können sich jedoch stark voneinander unterscheiden. Die erste Frage, die man sich als Nutzerin oder Nutzer stellen sollte, lautet: Was benötige ich von der KI? Zur Übersicht stellen wir Ihnen im Folgenden die wichtigsten Anwendungsmöglichkeiten vor und nennen einige bekannte Anbieter in jedem Bereich:

  • Bildgenerierung: Hier geht es schlicht darum, neue Bilder aus dem Nichts zu kreieren, und zwar in jedem erdenklichen Stil: ob fotorealistische Abbildung, Grafik oder Karikatur. Bekannte Dienste wie „Midjourney“ oder „Dall-E 2“, das genauso wie „ChatGPT“ – das Pendant im Bereich der Textgenerierung – vom Unternehmen OpenAI entwickelt wurde, funktionieren als Text-zu-Bild-Generatoren und können direkt im Browser verwendet werden. Mittlerweile sind beide Dienste, die vor allem unter Kreativen beliebt sind, kostenpflichtig. Wer kostenlose Alternativen wie „Stable Diffusion“ oder „Craiyon“ nutzt, muss bei der Qualität der Erzeugnisse Abstriche machen.
  • Bildbearbeitung: Ist ein Bild schon vorhanden, aber etwa der Kontrast zu schwach, die Farbe zu matt oder die Beleuchtung nicht ideal, kann ein KI-Tool bei der Bildbearbeitung in wenigen Sekunden leisten, was mit Programmen wie Adobe Photoshop deutlich länger dauern würde – und vor allem mehr Expertise erfordert. KI-Bildbearbeiter wie „Luminar Neo“ (für Profis entwickelt) oder „Canva“ (für Anfängerinnen und Anfänger geeignet) entfernen Bildrauschen, erhöhen die Auflösung oder ändern den Stil des Bildes, beispielsweise von Fotografie in Cartoon. Zum gewünschten Ergebnis gelangt man hier üblicherweise nicht durch die Eingabe von Textbefehlen, sondern über wenige Mausklicks.

Hinweis

Während die meisten Bildgeneratoren direkt im Browser funktionieren, stehen manche auch zum Download zur Verfügung. Aber Achtung: Nicht alles, was sich als KI-Bildgenerator ausgibt, ist auch ein seriöses Angebot. Worauf Sie im Browser achten sollten, verrät unser Beitrag „Sicheres Surfen“, während der Artikel „Sicherer Download: So erkennt man den Software-Wolf im Schafspelz“ wichtige Sicherheitstipps für das Herunterladen neuer Programme enthält.

Wie erstelle ich einen guten Prompt?

Der Schlüssel zu optimalen Ergebnissen sind gute Prompts, also die Textbefehle, die Sie der KI erteilen. Das gilt für Text- und Musikgeneratoren und umso mehr für Bildgeneratoren. Eine KI kann noch so leistungsfähig sein – wenn der Prompt nicht stimmt, ist auch das Ergebnis mit hoher Wahrscheinlichkeit wenig zufriedenstellend. Folgende Tipps sollten Sie beim Erstellen eines effektiven Prompts für Ihren Text-zu-Bild-Generator beachten:

  • Legen Sie den Stil fest: Als Erstes sollten Sie der KI eine klare Stilrichtung vorgeben: Soll das gewünschte Bild wie eine Fotografie, eine Bleistift-Skizze, ein 3D-Rendering oder wie ein Cartoon aussehen?
  • Nennen Sie das Motiv: Was soll auf dem Bild zu sehen sein? Das kann eine Person, ein Objekt, eine Landschaft oder ein Tier sein. Gehen Sie schon hier möglichst präzise vor, schreiben Sie beispielsweise „Windhund“ statt „Hund“ oder „Papst Franziskus“ statt nur „Papst“.
  • Beschreiben Sie wichtige Details: Was trägt die abgebildete Person? Welcher Tätigkeit geht sie gerade nach? Genaue Angaben lassen sich nicht nur bezüglich des Inhalts, sondern auch im Hinblick auf Stil und Form machen. Bei einem Gemälde können Sie beispielsweise die Vorgabe „im Stil des Kubismus“ hinzufügen.
  • Geben Sie der KI auch eine Anleitung zur Komposition: Die Ergebnisse werden noch besser, wenn Sie Details zur gewünschten Auflösung nennen sowie Angaben über Beleuchtungsstil, Seitenverhältnis und Kameraperspektive machen.
  • Gebrauchen Sie einfache und geläufige Begriffe, da die KI mit komplizierten und seltenen Wörtern weniger Erfahrung hat und daher schlechtere Ergebnisse liefert. Vermeiden Sie nach Möglichkeit abstrakte oder mehrdeutige Begriffe.
  • Fassen Sie sich kurz. Lange oder widersprüchliche Beschreibungen verwirren den Bildgenerator.
  • Informieren Sie sich über Funktionsweise und Bedienung des Tools, das Sie verwenden möchten. Jeder Bildgenerator funktioniert nämlich etwas anders.

Tipp

In puncto Datenschutz stecken die meisten KI-Generatoren noch in den Kinderschuhen. In welcher Weise die von Ihnen eingegebenen Daten verarbeitet werden, unterscheidet sich je nach Anbieter. Zur Sicherheit sollten Sie daher in Ihren Prompts keine privaten Informationen preisgeben.

Letzte Aktualisierung: 5. September 2023

Für den Inhalt verantwortlich: A-SIT Zentrum für sichere Informationstechnologie – Austria