AI-taidegeneraattoreilla on huono räppi tuottaa epätarkkoja käsien kuvauksia. Vertaillaan Midjourney v5:tä Dall-E 2:n kanssa nähdäksemme kumpi toimii paremmin.

AI-taidegeneraattorit tekevät edelleen vaikutuksen, ja niiden avulla voimme luoda melkein mitä tahansa, mitä voimme kuvitella. Tekniikka näyttää kuitenkin osuneen tiiliseinään, kun on kyse realistisen näköisten käsien luomisesta.

Tässä tarkastelemme kahta johtavaa generatiivista taidesovellusta ja kohdistamme ne toisiinsa – tai kädestä käteen – nähdäksemme, kumpi voi tuottaa parempia käsiä, Midjourney v5 vai Dall-E 2. Onko jompikumpi näistä sovelluksista hallitsenut kädet? Otetaan selvää!

Tekoälyn ongelma käsien kanssa

Siitä lähtien, kun tekoälyn tuottama taide levisi laajasti Internetissä, sitä on kritisoitu tekoälyn piirtämien käsien laatu. Huolimatta viimeaikaisista päivityksistä, kuten vierekkäisistä vertailuistamme käy ilmi, tulokset eivät ole olleet tyydyttäviä.

Molemmat kilpailijat ovat parantaneet kykyjään ja tulostensa laatua jokaisella iteraatiolla. Uusin päivitys,

Midjourneyn versio 5, on osoittanut vaikuttavaa edistystä. Tekoälyn piirtämien käsien ongelma on kuitenkin edelleen ratkaisematta, eikä sitä voida jättää huomiotta.

Vertailu 1: Kehotteiden "Käsi" ja "Kädet" käyttäminen

Vertailumme sisältävät täsmälleen samat kehotteet sekä Dall-E 2:lle että Midjourney v5:lle. Suunnittelemme kehotteet käsikohtaisiksi sen sijaan, että luomme ihmisiä näkemään, miltä kädet näyttävät. Annamme myös jokaiselle sovellukselle vain yhden mahdollisuuden (rullaa) jokaista kehotetta kohti.

Käsi

Aloitetaan asiat yksinkertaisimmalla ja olennaisimmalla kehotteella: "käsi".

Midjourney v5:

Dall-E 2:

Meillä ei ole hyvä alku!

Midjourney valitsi epätavallisen reitin yhdistämällä käden melko luoviin tilanteisiin. Sen sijaan, että keskittyisimme vain käteen, näemme velhon, hanskat, luurangon ja pienen hahmon. Käsinekuvasta puuttuu myös sormi.

Dall-E 2 ottaa päinvastaisen lähestymistavan ja tarjoaa meille vain yhden käden tavallista taustaa vasten. Mutta kummallista kyllä, on joitain outoja asentoja, erityisesti peukaloiden kanssa, jotka eivät näytä luonnollisilta tai mukavilta. Jokainen käsi on myös leikattu pois kuvien yhdeltä sivulta.

Kuka voittaa tämän kierroksen? Annamme sen Dall-E 2:lle yleisen tarkkuuden vuoksi.

Kädet

Tehdään nyt kehotteesta monikko "kädet" ja katsotaan mitä tekoälyt keksivät.

Midjourney v5:

Dall-E 2:

Midjourneyn yritys "käsiin" osoittautuu tällä kertaa paremmaksi. Mutta kaikki neljä kuvaa ovat mustavalkoisia, ja meiltä puuttuu sormia. Tarkemmin tarkasteltuna voit myös nähdä, että jotkin numerot ovat oudosti muotoiltuja tai muuttuvat toisikseen.

Dall-E 2:ssa on edelleen kädet, joissa on yksinkertainen tausta. Yhtään puuttuvaa numeroa ei ole, mutta kädet on leikattu pois kolmannesta kuvasta ja muut versiot vaikuttavat sommittelultaan jotenkin kömpelöiltä ja luovuudet puuttuvat kokonaan.

Kutsutaan tätä vertailua tasapeliksi. Dall-E 2 voittaisi tarkkuuden, jos se olisi ainoa tekijä, mutta Midjourney onnistuu luomaan kauniita kuvia mustavalkoisissa versioissaan, vaikka kaikki neljä versiota eivät ole kovinkaan hyviä realistinen.

Voit aina Korjaa Midjouney-taide Photoshopilla, mukaan lukien kädet.

Vertailu 2: Käsieleet

Verrataanpa paria käsielettä, jotka ovat lähes yleisesti tunnistettuja.

Sormet ristissä

Ensin kokeillaan "sormet ristissä".

Midjourney v5:

Dall-E 2:

On turvallista sanoa, että Midjourney petti tämän kehotteen täysin. Meiltä puuttuu sormet, eikä mikään versioista näytä ollenkaan luonnolliselta.

Hatun nosto vielä kerran Dall-E 2:lle sormien laskemisesta oikein, mutta se on ainoa hyvä uutinen. Jokainen versio näyttää siltä, ​​että sormet lyövät omia jooga-asentojaan Twister-pelissä.

Tässä vertailussa ei ole voittajaa.

Peukut pystyyn

Seuraavaksi mennään "peukku pystyyn".

Midjourney v5:

Dall-E 2:

Midjourney saa sormien määrän oikein ja käsittelee jokaista kehotetta luovasti. Huomaatko havainnollistavan tyylin käyttöönoton?

Dall-E 2 saa myös pisteitä tarkkuudesta, vaikka se ei yritä keinuttaa venettä lisäämällä jokaiseen tulokseen mitään luovaa.

Tässä ei ole selvää voittajaa.

Vertailu 3: Kädet esineillä

Nyt lisäämme monimutkaisuutta kehottamalla käsiä olemaan vuorovaikutuksessa esineiden kanssa.

Kädessä pitävä kristallipallo

Aloitetaan satunnaisesta esineestä käyttämällä kehotetta "käsi kristallipalloa".

Midjourney v5:

Dall-E 2:

Kun lisäämme monimutkaisuutta, Midjourney alkaa loistaa. Muutaman luonnottomalta näyttävän esityksen lisäksi kädet ja kristallipallot näyttävät kauniilta. Midjourney vie jopa aikaa luodakseen lasiin heijastuksia, jotka varmasti lisäävät yleistä luovuutta.

Mutta ensimmäistä kertaa näemme Dall-E 2:sta puuttuvan numero ainakin yhdestä kädestä, ja neljäs käsi näyttää aivan oudolta. Kristallipallot eivät myöskään näytä yhtä vaikuttavilta verrattuna Midjourney'siin.

Midjourney saa ensimmäisen voittonsa.

Käsissä vettä

Kokeillaan jotain vielä monimutkaisempaa kehotteen "käsissä vettä" avulla.

Midjourney v5:

Dall-E 2:

Midjourney onnistuu rullaamaan vain yhden kuvan oikealla määrällä numeroita. Vaikka se on kauniisti renderöity, alamme jälleen nähdä halkeamia uskottavuusosastolla.

Dall-E 2 kamppailee myös luonnollisten käsien kanssa, mutta tekee paljon parempaa työtä. Se vaihtaa myös taustan väriä jonkin verran vaihtelua varten.

Annamme tämän kierroksen Dall-E 2:lle.

Vertailu 4: Työskentelevät kädet

Tätä vertailua varten luomme kehotteita, joissa kädet ovat mukana toiminnassa.

Käsien muovaus savi

Katsotaan kuinka tekoälymallit pärjäävät "savea muovattaessa".

Midjourney v5:

Dall-E 2:

Midjourney jätti sormen väliin kahdessa kuvassa, mutta kaikki muu näyttää hyvältä.

Dall-E 2:n kuvat näyttävät hämmentävältä ja täynnä, ja puolet versioista turvautuu toisen henkilön käsien lisäämiseen.

Reuna menee Midjourneyyn.

Kädet Painamalla taikinaa

Kokeillaanpa samanlaista toimintaa, "taikinan painaminen kädet".

Midjourney v5:

Dall-E 2:

Midjourneyn kuvat näyttävät kaiken kaikkiaan upeilta. Mutta jälleen kerran, puolella niistä puuttuu numeroita. Mutta kuvien taiteellista tyyliä ei voi moittia.

Dall-E 2:n versioista puuttuu sormet myös puolessa toistoista, ja ne jopa lisäävät yhden sarjan viimeiseen käteen.

Kutsutaan tätä tasapeliksi.

Jos haluat kokeilla näitä vertailuja itse, näytämme sinulle kuinka käyttää Midjourneya tekoälytaiteen luomiseen.

Mitä tulokset kertovat meille?

On hauskaa tehdä vertailuja ja määrittää kokonaisvoittaja. Ja jos meidän pitäisi valita, kutsuisimme sitä Midjourney v5:n hyväksi. Vaikka Dall-E 2 loi käsiä, joissa oli oikea määrä sormia, useammin, Midjourney loi taiteellisemmin renderöityjä ja houkuttelevampia kuvia.

Mutta molemmilla sovelluksilla on paikkansa markkinoilla taiteilijoille, jotka käyttävät Dall-E 2- ja Midjourney-kuvia uudelleen työssään. Molemmat pystyvät luomaan käsiä, joita voidaan käyttää leikkauksina tai yhdistelmänä taiteelliseen, toimitukselliseen ja kaupalliseen käyttöön. Se on vain henkilökohtaisista mieltymyksistä kiinni.

Tekoäly valloittaa lopulta kädet

Generatiiviset taidesovellukset, kuten Dall-E 2 ja Midjourney, ovat edenneet pitkälle kyvyssään luoda realistista ja fantastista taidetta. He kamppailevat edelleen luovien käsien kanssa, mutta kun otetaan huomioon generatiivisen tekniikan kiihtyminen, voimme odottaa vain parannusta lähitulevaisuudessa.