Vain kuukausia sitten, jos halusit luoda kuvan jostakin, sinun piti pystyä luonnostelemaan, maalaamaan tai käyttämään jotakin Photoshopping-työkaluista, joista muut puhuvat. Vuoden 2022 jälkeen kaikki kuitenkin muuttui, kaikki tekoälyn ansiosta – kyllä, kuten "tekoälyssä".

Sen sijaan, että yrittäisivät hallita maailmaa, taiteelliset tekoälytyökalut voivat muuttaa kaiken kuvailemasi kuvaksi.

Tule mukaan, kun astumme tekoälypohjaisen tekstin visualisoinnin maailmaan, ja katso, kuinka voit käyttää tällaisia ​​työkaluja muuntaaksesi ajatuksesi todellisiksi kuviksi kirjoittamalla mitä ajattelet.

Dall-E: OpenAI: n GPT-3:n taiteellinen puoli

Ensimmäiset tekoälyllä toimivat työkalut, joista tuli suosittuja, perustuivat OpenAI: n GPT-3:een. Yksi syy oli hankkeen avoimuus ulkopuoliselle pääsylle, mikä johti joihinkin ehdotuksiin GPT-3 on luovan työn tulevaisuus.

Tänään voit käyttää virallisia työkaluja, jotka löydät osoitteesta OpenAI: n beta-sivusto tai kolmannen osapuolen ratkaisuja, jotka hyödyntävät sen kielellisiä supervoimia. Voit esimerkiksi pyytää GPT-3:a laatimaan tekstin luonnoksen, vastaamaan yksinkertaisiin kysymyksiin tai jopa tarkistamaan tai kääntämään tekstiä.

instagram viewer

Vuonna 2022 OpenAI paljasti, että GPT-3 oli yhtä hyvä kuvien luomisessa. DALL-E-projekti, näytelmä Pixarin WALL-E-elokuvasta ja Dalin nimestä, käyttää GPT-3:a ei tekstin kanssa työskentelyyn vaan kuvantekomoottorina.

Aivan kuten GPT-3 ja teksti, DALL-E ei ole luova nero, joka materialisoi kuvia tyhjästä. Sen sijaan se on "koulutettu" miljoonien kuvien perusteella, jotka ovat jo olemassa verkossa. Sen tekoälyvoimat ovat näiden kuvien analysointi, elementtien ottaminen niistä, säätäminen, muuntaminen, säätäminen ja lopuksi niiden yhdistäminen uusiksi kuviksi.

Ainakin se on yksinkertaistettu versio siitä, mitä taustalla tapahtuu. Useimmat ihmiset välittävät vain siitä, mitä he näkevät edessään, ja se on tekstiruutu, johon voit kirjoittaa jotain ja nähdä sen muuttuvan kuvaksi muutaman minuutin kuluttua.

Googlen kuvavastaus

Google on yksi kolmesta suurimmasta tekoälytutkimuksen "pelaajasta". Silti niiden edistymistä ei ole helposti havaittavissa, eivätkä niiden toteutukset tuotteiksi ole yhtä helposti saatavilla kuin OpenAI: n tarjoukset.

Yksi Googlen AI: n ensimmäisistä laajalti saatavilla olevista toteutuksista oli Google Docsissa ja Gmailissa älykkäämmän automaattisen täydennyksen ja ehdotusten muodossa, jotka tunnetaan nimellä Smart Compose. Emme sukeltaa yksityiskohtiin, koska olemme käsitelleet niitä aiemmin Älykäs kirjoittaminen (ja kuinka voit käyttää sitä).

Kun nämä ominaisuudet ovat käytössä, Googlen verkkosovellukset vertaavat käyttäjän kirjoittamia tietoja siihen, mitä miljoonat muut ovat kirjoittaneet aiemmin. Sitten se ehdottaa, mitä he kirjoittivat jälkeenpäin.

Se on todiste siitä, että huolimatta siitä, mitä haluamme uskoa, emme ole niin erilaisia. Jos 99 ihmistä 100:sta kirjoittaa sanan "nähdään" perään, jatkaisimme myös kirjoittamista.

Olemme kaikki käyttäneet jonkinlaista automaattista täydennystä, jopa "tyhmäpuhelimen" aikakauden T9-ennakoivassa tekstijärjestelmässä. Siksi Googlen tekoälytyökalut eivät vaikuttaneet yhtä älykkäiltä kuin OpenAI: n GPT-3. Ne eivät tuntuneet yhtä paljon käytetymmiltä kuin parempi T9-järjestelmä, jota parannettiin 2000-luvulle. Ja siksi Imagenin paljastus oli hieman järkytys.

Kuten steroidien DALL-E, Imagen on tekstin visualisointityökalu. Nykyään saatavilla olevien ominaisuuksien perusteella Imagen voi tuottaa "puhtaampaa" ja eloisampaa kuvaa samalla, kun se tietää kuinka käsitellä edistyneitä ominaisuuksia, kuten diffuusiota ja läpinäkyvyyttä.

Valitettavasti pääsyä Imageniin on kirjoitettaessa rajoitettu, joten emme voineet kokeilla sitä.

DALL-E Mini ja ystävät: avoinna yrityksille

Et voi käyttää DALL-E: tä ja Imageniä vapaasti – vielä. Silti monet vaihtoehdot ovat jo saatavilla, jos haluat huijata tekoälyllä toimivan tekstikuvien luomisen kanssa.

Ottaen huomioon, että nämä ovat alkuajoja ja niiden tarjoamat tulokset tai käyttökokemus eivät ehkä ole kaukana optimaalisesta, kannattaa silti tutustua joihinkin seuraavista.

Meemien tekeminen Dall-E Minillä

Enemmän kuin riittävien tulosten ja käyttäjäystävällisen käyttöliittymän yhdistelmän, mutta mikä tärkeintä, laajan saatavuuden ansiosta DALL-E ministä tuli yksi suosituimmista tekoälyn tekstin visualisoijista.

Kaukana täydellisestä, joskus DALL-E minin tulokset voivat olla abstraktimpia kuin oli tarkoitettu.

Toisinaan se saattaa epäonnistua luomaan sitä, mitä ajattelit, mutta voi päästä melko lähelle.

Sen räjähdysmäisen suosion jälkeen DALL-E minin luojat muuttivat sen uuteen kotiin uuden tuotemerkin alla. Nyt löydät DALL-E minin uusimman version nimellä Craiyon omalla sivustollaan.

Craiyonin käyttäminen on nykyään yhtä helppoa kuin olemassa olevan kuvan etsiminen verkosta. Voit vierailla sen sivustolla, kirjoittaa kuvasi kuvauksen tekstikenttään ja painaa Enter. Hetken kuluttua näet tulokset näytölläsi.

Hämmästyttävää on, kuinka hyviä Craiyon ja vastaavat työkalut matkivat visuaalisia tyylejä. Olemme esimerkiksi pyytäneet sitä loihtimaan kuvia pennusta rullalaudalla:

Sitten käytimme tarkkaa ilmausta, mutta lisäsimme sen jälkeen "Pixar-tyylin". Jonkin ajan kuluttua Craiyon näytti ruudukon "sarjakuvaisempia" kuvia, jotka olivat lähempänä sitä, mitä pidämme Pixarin sädejäljitettynä grafiikana heidän rakastetuissa elokuvissaan.

Craiyon antoi meille vielä parempia tuloksia, kun korvasimme "Pixar stylen" sanalla "anime style" samassa kehotteessa.

Anime on tyylitelty ulkonäöltään kuin Pixarin realistisempi kuva, mikä näyttää auttavan Craiyonia tuottamaan melkein käyttövalmiita kuvia.

Huijaaminen piilevän diffuusion kanssa

Latent Diffusion -malli, joka on koulutettu LAION-400M-tietojoukolle, on toinen mielenkiintoinen tekoälyn tekstin visualisoija. Sen käyttö on kuitenkin myös monimutkaisempaa. Sinun on suoritettava se verkossa virtuaalikoneessa ja leikittävä sen eri parametreilla sen sijaan, että kirjoittaisit vain tekstikenttään. Silti se on helpompaa kuin miltä se kuulostaa.

  1. Vieraile Google Latent Diffusion -yhteistyötila se on tällä hetkellä sen koti.
  2. Vieritä hieman alaspäin ja huomaa Kehote kenttä alla Parametrit. Korvaa oletuskehote sillä, mitä haluat kuvasi esittävän.
  3. Valita Suorita kaikki alkaen Suoritusaika valikosta tai paina CTRL + F9.
  4. Jos haluat viedä tuotetut kuvat suoraan työkalusta, vastaa myöntävästi, kun kysytään haluatko linkittää sen Google Drive -tiliisi. Työkalun määrittäminen kestää jonkin aikaa, ja sen on ladattava joitain tiedostoja prosessin aikana.

Nostetaan arvoja Askeleet, Iteraatiot, ja Näytteet_rinnakkaisina, voi johtaa tarkempiin tuloksiin. Työkalu on kuitenkin erittäin vaativa resurssien suhteen Googlen palvelimilla. Tämän seurauksena se voi kaatua, jos nostat näitä arvoja liikaa, tai tietyn kuvan luontiprosessista tulee odotettua monimutkaisempi.

Mielenkiintoisia vaihtoehtoja

Olemme käyttäneet paljon aikaa DALL-E minin ja Latent Diffusionin testaamiseen. Tieteellinen menetelmämme koostui kahdesta erillisestä osasta. Ensin meidän täytyi keksiä käsitteitä, jotka voitaisiin kuvata tarkasti tyhmiksi. Pyydä sitten tekoälyn visualisoijia muuttamaan ne kuviksi. Odotettua useammin he onnistuivat ja lähestyivät yleistä järjestelyä, jonka olimme kuvitelleet.

Olemme myös kokeilleet joitain tämän artikkelin käytettävissä olevia vaihtoehtoja. Odotamme edelleen pääsyä muille. Jotkut näkemisen arvoisista ovat (ei tietyssä järjestyksessä):

  • Keskimatka
  • MindsEye beta
  • StarryAI
  • Unelma
  • Disco diffuusio

Korvaako tekoälyn luoma taide visuaalisen taiteen?

Kuvia luovien tekoälykäyttöisten työkalujen runsaus ja jatkuvasti kasvava suosio saavat monet päättelemään, että kuvataide kuolee pian. Mitä järkeä on sijoittaa aikaa ja energiaa piirtämiseen tai monimutkaisten ohjelmistojen avulla asioiden visualisointiin, kun tekoäly pystyy tekemään sen nopeammin (ja pian paremmin) kuin sinä?

Jos huomasit, nämä työkalut ovat kaikki "koulutettuja tietojoukkoihin". Selkeästi englanniksi tämä tarkoittaa, että he tekevät mitä tekevät, koska ihmiset ovat tehneet saman asian aiemmin.

Tämä on vihje sille, miksi nuo työkalut eivät voi korvata ihmisen taiteellisuutta, luovuutta ja kekseliäisyyttä. Ne ovat jäljitelmiä, älykkäitä replikaattoreita. Ilman ihmisen tuottamia alkuperäiskappaleita, joihin heidät on koulutettu, he eivät pystyisi tuottamaan tulosta.

Silti se on nyt, ja myönnämme, että emme tiedä mitä tulevaisuus tuo tullessaan. Toistaiseksi kuvataiteilijat voivat nukkua turvallisesti. Tekoäly kehittyy vauhtia, mutta monet aiheen asiantuntijat ovat yhtä mieltä siitä, että ei ole kysymys siitä, korvaako se koskaan kaltaisten ihmisten työtä. On vain kysymys milloin.

Mutta hei, kaikki ei ole tuhoa ja synkkyyttä. Skynet valmistautuu ottamaan vastaan ​​työmme, mutta voimme ainakin piristää mielialaamme luomalla vaivattomasti kuvia pennuista rullalaudoilla!