Es ist eines der ersten Text-zu-Bild-Tools und das beste, das wir getestet haben. Mit Dall-E ebnet OpenAI den Weg für generative KI, die Texthinweise in Bilder umwandelt. Es gibt jetzt mehr Konkurrenz, aber Version 3 des Dienstes läuft immer noch gut.
In Tests, in denen Adobe Firefly und Google ImageFX verglichen wurden, stellte ich fest, dass der Dall-E 3 am besten realistische und auffällige Bilder verarbeiten konnte und fast immer am besten mit surrealen Illusionen umgehen konnte. Es ist etwas langsam, wird Ihnen aber beim ersten Versuch wahrscheinlich gute, brauchbare Ergebnisse liefern, insbesondere wenn Sie eher Spaß als matschige KI-Fantasien suchen.
Dall-E ist auch großartig darin, Sie dazu zu ermutigen, loszulassen und Möglichkeiten zu erkunden. Ich glaube, dass Designer, Künstler, Programmierer und andere in der Lage sind, ihre Visionen in die Realität umzusetzen, aber ich bin nicht so geschickt. Für mich ist der Dall-E ein Wunder.
OpenAI sagt, dass es die an Dall-E 3 übermittelten Daten verwenden darf, um die Modellleistung zu verbessern, Inhalte mit einer ausgewählten Gruppe „vertrauenswürdiger Dienstanbieter“ zu teilen und die Daten nicht für Marketingzwecke zu verkaufen oder sie mit Inhalten Dritter zu teilen. Sie können auch eine Datenschutzanfrage stellen, damit OpenAI Ihre Daten nicht mehr für Schulungen verwendet, oder Ihr Konto löschen. Weitere Informationen finden Sie in den allgemeinen Datenschutz-FAQs und der Kern-Datenschutzrichtlinie von OpenAI.
Hier meine weiteren Erkenntnisse zum Dall-E 3.
Wie CNET einen KI-Bildgenerator getestet hat
CNET verfolgt bei der Überprüfung von KI-Bildgeneratoren einen praktischen Ansatz. Unser Ziel ist es herauszufinden, wie es im Vergleich zur Konkurrenz abschneidet und wofür es am besten geeignet ist. Dies erreichen wir, indem wir KI-Techniken bereitstellen, die auf realen Anwendungsfällen basieren, wie z. B. das Rendern in bestimmten Stilen, das Kombinieren von Elementen in einem einzigen Bild und die Verarbeitung langer Beschreibungen. Wir bewerten Bildgeneratoren auf einer 10-Punkte-Skala, die Faktoren wie die Übereinstimmung des Bildes mit der Aufforderung, die Kreativität und die Reaktionsfähigkeit der Ergebnisse berücksichtigt. Erfahren Sie mehr darüber, wie wir künstliche Intelligenz testen.
Wie sieht das Bild aus? Wie gut passt es zur Eingabeaufforderung?
ChatGPT ist das beste Text-zu-Bild-KI-Tool, das ich je ausprobiert habe, und liefert Ergebnisse, die nützlich, interessant und vertrauenswürdig sind. Es wurden immer noch viele Fehler gemacht, zum Beispiel, dass der Schläger des Pickleball-Spielers aus seinem Kopf herauswuchs und nicht aus dem Schlägergriff, aber die Ergebnisse weckten in mir den Wunsch, weiter zu forschen, anstatt den Browser-Tab zu schließen. Er schafft es besser mit dynamischen Szenen, Engagement und Interaktion zwischen verschiedenen Themen und Emotionen.
ChatGPT ist ein wichtiger Bestandteil von Dall-E. Es verstärkt Ihre Aufforderungen, fügt großartigen Text hinzu und verleiht den Ergebnissen Dramatik. Es fördert auch einen gesprächigen Nutzungsstil: Sie können ein Bild anfordern und dann Anpassungen anfordern, ohne die gesamte Anfrage erneut einzureichen
Durch die Umwandlung Ihrer Leads in den gewünschten Inhalt und die korrekte Kombination mehrerer Elemente hilft Dall-E 3 dabei, die Konkurrenz, einschließlich Adobes Firefly und Googles ImageFX, zu übertreffen
KI-generierte Bildanzeige
Sehr attraktiv. Der Dall-E 3 erzeugt durchweg lebendige, auffällige Bilder. Auch wenn es Probleme gibt, macht es mir meistens Spaß. Sie bringen mich manchmal zum Lachen und lassen mich die kleinen Details wahrnehmen.
Allerdings kann der sprachlich extremistische Ansatz von Dall-E 3 manchmal abschreckend wirken. Ein Dutzend Monitore verfolgen Herzschlag- und Atemdaten und liefern gleichzeitig Bilder von Ärzten und Patienten, die von medizinischen Geräten umgeben sind. Einer der Computer verfügt über eine Tastatur mit etwa 100 Tasten.
KI generiert ein Retro-TV-Bild einer Wand, die mit Retro-TV-Sendungen bedeckt ist
Dall-E 3 hat dieses Bild einer Wand voller Retro-Fernseher und Retro-TV-Sendungen erstellt.
Sie können anfordern, dass das Bild auf Breitbild, Hochformat oder Querformat eingestellt wird, und die KI wird dies tun, aber wenn Sie mit einem neuen Bild auffordern, wird es manchmal auf die quadratische Standardeinstellung zurückgesetzt. Mehr als einmal habe ich ein quadratisches Bild erhalten, das mir gefallen hat, aber man kann nicht einfach darum bitten, dass das Bild vergrößert wird. (Wenn Sie dies jedoch tun möchten, können Sie die Generate-Erweiterung von Photoshop verwenden.)
Wie schnell kommen Bilder an?
Ich denke, Warten lohnt sich immer. Normalerweise dauert es 20 bis 30 Sekunden, bis der Dall-E 3 ein Foto macht. Da dies oft meine Geduld auf die Probe stellt, nehme ich mir normalerweise ein paar Minuten Zeit, um meinen E-Mail-Posteingang zu überprüfen, und komme dann zurück, um die Ergebnisse zu sehen