Jeden Tag sprießen neue KI-Tools aus dem Boden.
„Gute“ Bilder-KIs gibt es mittlerweile einige, wir beleuchten hier die fünf aktuell stärksten Bildgeneratoren – Flux, Stable Diffusion, Recraft (auch bekannt als Red Panda), Ideogram und Midjourney.
Wir betrachten für unser „Duell“ die Tools und bewerten unterschiedliche Kriterien
- Qualität des Outputs
- Geschwindigkeit
- Eignung für eine make.com-Automatisierung (Affiliate-Link)
Wichtig: Vorweg anzumerken ist, dass wir durch den direkten Vergleich die toolspezifischen Konfigurationen nicht nutzen konnten. Entsprechend sind Ergebnisse von manchen Generatoren schlechter, als du es vielleicht erwarten würdest! Die Ergebnisse von DALL-E habe ich manuell im Nachgang ergänzt.
➡️Beispielbilder und Video weiter unten!
Die wichtigsten KI-Bildgeneratoren im Vergleich
FLUX.1
Flux hat im Experiment auf ganzer Linie überzeugt. Innerhalb weniger Sekunden entstehen beeindruckende Bilder mit hoher Farbintensität und klarer Struktur. Besonders auffällig ist die Detailgenauigkeit und realistische Darstellung von Flux. Ein „Fail“ war nicht dabei. Eine Integration mit make.com ist super einfach.
Stable Diffusion
Stable Diffusion hat ebenfalls gute Ergebnisse geliefert und war schnell dabei. In unserem Beispiel allerdings hatte Stable Diffusion mit einem der Prompts Schwierigkeiten, was zu einer ungewöhnlichen Interpretation führte – einem Panthergesicht. Der Fischermann war auch… sagen wir mal: gewöhnungsbedürftig! Auch Stable Diffusion lässt sich mit make.com einfach automatisieren.
Recraft (Red Panda)
Recraft oder Red Panda punktet ebenfalls durch richtig gute Bilder. Im Experiment finden wir die Ergebnisse besonders realistisch. Ein Fail war definitiv nicht dabei, der Horrorhamster ist mir persönlich aber ein bisschen zu langweilig. Für die Automatisierung kann die Nutzung jedoch etwas komplizierter sein, da die Bildgenerierung nur im WebP-Format erfolgt und somit potenziell eine Nachbearbeitung notwendig ist.
Ideogram
Ideogram ist eigentlich der Hammer. Im Experiment konnte der KI-Bildgenerator aber nicht vollends überzeugen. Wir machen dafür das zu generische Prompting verantwortlich. Insgesamt ist Ideogram auch ein bisschen langsamer als die anderen Tools. Wenn du es automatisieren möchtest lohnt es sich definitiv mehr Zeit ins Prompting zu investieren!
Midjourney
Midjourney ist unter Nutzern eigentlich besonders beliebt und schon seit langer Zeit der Platzhirsch. Aber: Die Ergebnisse sind echt nur in Ordnung und noch viel gewichtiger: Da Midjourney keine offene API bietet, ist für die Automatisierung ein externer Anbieter notwendig, was die Integration erschwert. Midjourney ist deshalb nicht unser Favorit.
DALL-E
Diesen Generator hatten wir im Experiment gar nicht betrachtet. Der Hintergrund: Die Ergebnisse können einfach nicht mit den anderen Anbietern mithalten. Das zeigt sich auch in den manuell erzeugten Beispielen. Ein großer Pluspunkt ist allerdings, dass du kein zusätzliches Tool brauchst (OpenAI reicht) und es somit sehr gut für schnelle Tests geeignet ist. Ansonsten würde ich dir DALL-E nicht unbedingt empfehlen.
Beispielbilder der führenden KI-Bildgeneratoren
Folgende KI-Bildgeneratoren haben wir verglichen:
- Flux 1.1
- Stable Diffusion 3.5
- Recraft V3 (Red Panda)
- Ideogram V2
- Midjourney 6.1
- DALL-E3
Ich denke viele Kommentare braucht es nicht… Die Bilder sprechen für sich!
Die verwendeten Prompts findest du im nächsten Abschnitt.
Diese Prompts (Prompthero, modifiziert) haben wir genutzt:
- Photo of an elegant staircase in an old Italian villa, with a marble patterned floor and a small round table at the bottom holding some flowers.
- An image of a very tired old man, fisherman, long beard, black background settings, highly details. The facial expression reflects wisdom and test of time. Masterpiece
- Hyperrealistic style, portrait photo of a Viking warrior chief, tribal panther makeup, red on black, front profile, looking ahead, texture detail skin, serious eyes, looking the camera, hard rim lighting photography
- A dreamy illustration of an infinite staircase leading to the universe, with books and characters on each step. The figure at its center is walking up it, symbolizing continuous learning in the style of magic realism. Dark tones and glowing light create depth, while swirling patterns suggest vastness.
Ein kurzes Wort zur Make-Integration
Für unser Experiment wurden alle Bildgeneratoren mithilfe von Make in eine Automatisierung integriert. Die meisten Tools lassen sich problemlos einbinden.
Wie kann ich die unterschiedlichen KI-Bildgeneratoren mit make.com automatisieren?
Die Bildgeneratoren lassen sich einfach einbinden und automatisieren. Am kompliziertesten ist Midjourney.
- Flux über FAL.ai
- Stabel Diffusion über FAL.ai
- Recraft Red Panda über FAL.ai
- Ideogram über eigene API
- Midjourney über userapi
- DALL-E direkt über OpenAI
Videos: Anbindung der KI-Bildgeneratoren per API
Für viele der Generatoren haben wir mittlerweile Videos! Diese findest du in unserer Playlist auf YouTube. Im ersten Video, das du hier siehst, ist die Übersicht über die Generatoren (mit Ausnahme DALL-E).
Welches KI-Tool ist jetzt das beste für Bilder?
Das optimale Tool hängt stark von den Anforderungen ab. Alle Tools sind definitiv zu gebrauchen und liefern gute bis sehr gute Ergebnisse.
Am besten geeignet für Automatisierungen sind aktuell nach unserer Meinung FLUX.1 (Stand November 2024)
Aber das kann sich bekanntlich schnell ändern…