April 24, 2024

askAHYO.com

Nachrichten, ausgefallene Geschichten und Analysen zum deutschen und internationalen Geschehen. Tauchen Sie tiefer ein mit unseren Features aus Europa und darüber hinaus. Sehen Sie sich unseren 24/7-TV-Stream an.

Das KI-Bildgebungsgerät Midjourney v5 verblüfft mit realistischen Bildern und Händen mit fünf Fingern – Ars Technica

Das KI-Bildgebungsgerät Midjourney v5 verblüfft mit realistischen Bildern und Händen mit fünf Fingern – Ars Technica
Hineinzoomen / Beispiel für Beleuchtungs- und Hauteffekte in Midjourney v5 AI Photo Creator.

Am Mittwoch Medjourney bekannt geben Version 5 eines kommerziellen KI-Bildsynthesedienstes, der fotorealistische Bilder auf einem Qualitätsniveau erzeugen kann, das einige KI-Kunstliebhaber fordern Verdächtig Und „So perfekt. Midjourney v5 ist jetzt als Alpha-Test für Kunden verfügbar, die den Midjourney-Dienst abonnieren, der über Discord erhältlich ist.

sagte Julie Weiland, Grafikdesignerin Er macht oft mit Ihre Midjourney-Kreationen auf Twitter. „Plötzlich sieht man alles in 4K, es fühlt sich seltsam überwältigend, aber auch erstaunlich an.“

Wieland hat einige seiner Generationen von Midjourney v5 mit Ars Technica geteilt (unten in der Galerie und im Hauptbild oben gezeigt), und es zeigt sicherlich Fortschritte bei den Bilddetails, seit Midjourney erstmals im März 2022 auf den Markt kam. Version 3 debütierte im August und Version 4 erschien erstmals im November. Jede Iteration fügte den generierten Ergebnissen mehr Details hinzu, wie unsere Experimente zeigen:

Vergleich der Ausgabe von Midjourney v3 (links), v4 (Mitte) und v5 (rechts) auf dem Router
Hineinzoomen / Vergleich der Ausgabe von Midjourney v3 (links), v4 (Mitte) und v5 (rechts) mit der Behauptung „Ein muskulöser Barbar mit Armen neben einem CRT-Fernseher, Kino, 8K, Studiobeleuchtung“.

Ars Technica

Midjourney funktioniert ähnlich wie Bildmacher wie Stable Diffusion und DALL-E, indem es Bilder auf der Grundlage von Textbeschreibungen, die als „Eingabeaufforderungen“ bezeichnet werden, mithilfe eines künstlichen Intelligenzmodells generiert, das auf Millionen von künstlichen Kunstwerken trainiert wurde. Kürzlich stand Midjourney im Mittelpunkt einer Urheberrechtskontroverse um ein Comicbuch, das frühere Versionen des Dienstes verwendet.

Siehe auch  Gerüchten zufolge soll der Rahmen des iPad Pro dieses Jahr dünner werden

Nachdem er v5 einen Tag lang ausprobiert hatte, bemerkte Weiland Verbesserungen, darunter „unglaublich realistische“ Hauttexturen und Gesichtszüge. realistischere oder filmische Beleuchtung; bessere Reflexionen, Blendung und Schatten; ausdrucksstärkere Winkel oder Übersichten einer Szene und „Augen, die fast perfekt und nicht mehr wackelig sind“.

Und natürlich die Hände.

Im vergangenen Jahr ist die Idee, dass KI-Entwickler Hände nicht richtig rendern können, zu einer Sache geworden Kulturelle Metapher. Bemerkenswerterweise kann Midjourney v5 realistische menschliche Hände ziemlich gut reproduzieren. „Die Hände sind die meiste Zeit korrekt, mit 5 Fingern statt 7-10 an einer Hand“, sagte Weyland.

In den Discord-Versionshinweisen des Dienstes stellte Midjourney auch fest, dass Version 5 jetzt mit „einem viel breiteren stilistischen Spektrum“ als Version 4 antwortet, während sie gleichzeitig sensibler für Eingabeaufforderungen ist, weniger Spam-Text generiert und eine 2-fache Erhöhung der Bildauflösung bietet.

Wenn es einen sichtbaren Nachteil von Midjourneys Aufwertung von Kunstliebhabern mit KI gibt, könnte es daran liegen, dass die Bilder so realistisch und „perfekt“ sind, dass die Präzision des Modells etwas von dem Nervenkitzel nimmt, wiederholt KI-Bilder zu erstellen, um ein passendes Ergebnis zu finden. was man „den Spielautomateneffekt“ nennen könnte. Obwohl ein Twitter-Nutzer Philip Linsen hieß männlich„Wenn Sie ein bestimmtes Fotothema im Auge haben, ist es immer noch ein bisschen wie eine Lotterie. Aber mit höheren Gewinnchancen als v4.“

Siehe auch  Halo- und Destiny-Entwickler Bungie startet das klassische FPS-Franchise Marathon neu