Tekoälytyökalut musiikin tuotannossa eivät ole mitään uutta. Mutta entä tyhjästä tekoälyllä luotu musiikki? Sekin on nyt todellisuutta.
Generatiivinen tekoäly leviää hitaasti yhä useammalle luovan teollisuuden aloille. Se sai alkunsa AI-taidegeneraattoreista ja levisi sitten kirjoittamiseen tekoälyn luomalla tekstillä. Nyt voimme lisätä musiikkia tähän luetteloon.
Lähitulevaisuudessa tekoälyn luomasta musiikista, joka on syntynyt tyhjästä, tulee todellisuutta. Itse asiassa se on jo mahdollista Jukeboxilla, OpenAI: n musiikkia tekevällä tekoälymallilla. Se ei ole vielä saatavilla helppokäyttöisessä sovelluksessa, eikä se vielä kuulosta tarpeeksi hyvältä, mutta algoritmiset luut ovat olemassa.
Tässä on mitä sinun tulee tietää OpenAI: n Jukeboxista ja mitä voit tehdä sillä.
Jukebox: AI, joka luo musiikkia raakaäänenä
Jukebox on hermoverkko, joka voi tuottaa musiikkia raakaäänimuodossa, kun annat sille syötteen, kuten genren, artistin tai sanoitukset. Sen julkaisi huhtikuussa 2020 OpenAI, sama yritys, joka toi meille Dall-E-nimisen AI-taidegeneraattorin ja ChatGPT-nimisen AI-chatbotin.
Toisin kuin Dall-E, joka levisi nopeasti ympäri maailmaa ja teki tekoälystä kuumeisen uutis- ja mediaaiheen, Jukebox ei osoittanut suurta kiinnostusta julkaisunsa jälkeen. Yksi syy tähän on, että sillä ei ole käyttäjäystävällistä verkkosovellusta – ainakaan vielä.
Löydät koodin osoitteesta OpenAI-verkkosivusto, sekä perusteellinen selitys koodaus- ja dekoodausprosessin toiminnasta.
Toinen todennäköinen syy on se, että se vie valtavasti aikaa ja laskentatehoa. Jotta saat käsityksen, vain minuutin äänentoisto voi kestää 9 tuntia. Tarvitset halukkuutta tutkia mallia sen koodimuodossa sekä paljon kärsivällisyyttä, jos haluat nähdä, mitä tekoälymalli voi tehdä musiikin tuottamiseksi.
Tai voit siirtyä kohtaan Jukebox Sample Explorer. Täällä OpenAI on julkaissut kokeilunsa Ella Fitzgeraldin tai 2Pacin kaltaisten kappaleiden luomisesta.
Selvyyden vuoksi muut AI-musiikkityökalut olemassa auttamaan sinua luomaan kappaleen, mutta ne eivät tuota ääntä tyhjästä. Sen sijaan ne joko yhdistävät valmiiksi tallennettuja näytteitä tai luovat MIDI-informaatiota, joka viedään digitaalisen syntetisaattorin läpi.
Miltä Jukebox kuulostaa?
Jukeboxin tulokset ovat tunnistettavia, mutta outoja. Ei ole vaikeaa ymmärtää kappaleen muotoa ja genreä, johon se kuuluu, vaan tulosten laatua saa sen kuulostamaan siltä, kuin kuuntelet jotain aikaisinta tallennettua musiikkia: toisin sanoen vaimennettuna melua.
On turvallista sanoa, että Jukebox ei tuota sellaista korkealaatuista ääntä, jonka kuulisit hyvistä kuulokkeista. Se muistuttaa enemmän musiikin kuulemista radioasemalta, jota ei ole viritetty täysin oikealle taajuudelle. Jotkut kappaleet ovat uudelleentoistoja, kun taas toiset ovat jatkoa olemassa oleville kappaleille. Siellä on myös luokka uusille taiteilijoille ja tyyleille sekä ennennäkemättömille sanoituksille.
Äänenlaadusta huolimatta varhaiset kokeilijat kuvailevat olevansa hämmästynyt Jukeboxin luoman musiikin aavemaisesta kauneudesta ja omituisesta luonteesta. "Kuin ääniraita dokumentaatioon tuntemattomasta maasta, jolla on tuntematon kulttuuri", kirjoittaa Merzmench on Medium.
Tällä hetkellä tulokset eivät ole läheskään tarpeeksi hyviä kopioimaan tai jopa korvaamaan ihmisten luomaa musiikkia, mutta tekniikka kehittyy nopeasti ja pian Jukeboxin kaltaiset mallit pystyvät saavuttamaan nämä saavutukset liian.
Kuinka OpenAI: n Jukebox koulutettiin
Osa siitä, kuinka Jukebox pystyy luomaan musiikkia, jota ei ole koskaan ennen ollut, on se, että se on koulutettu oikeiden muusikoiden musiikilla. OpenAI selittää, että:
"Kokeillaksemme tätä mallia indeksoimme verkkoa ja kuroimme uuden tietojoukon, joka sisältää 1,2 miljoonaa kappaletta (joista 600 000 on englanninkielisiä), yhdistettynä vastaaviin LyricWikin sanoituksiin ja metatietoihin."
Tiedon indeksointi on käytäntö, jota jotkut tekoälyyritykset käyttävät luodakseen tietojoukon, josta tekoälymalli voi oppia ja tehdä päätöksiä luodessaan kuvaa, tekstiä tai tässä tapauksessa musiikkia. Indeksoimalla luodut tietojoukot ovat kiistanalaisia, koska suostumusta ei hankita tietojen omistajilta. Jotkut alustat kuitenkin sallivat sen poista sisältösi tietojoukoista.
Saatat ajatella, että 1,2 miljoonaa kappaletta on paljon, mutta verrattuna Dall-E 2:een opetettiin satoja miljoonia kuva-teksti-pareja Internetistä. Tätä silmällä pitäen Jukeboxilla on rajoituksensa.
Sen suhteellisen pieni koulutusallas ei pysty vangitsemaan ihmisten musiikin rikkautta ja monimuotoisuutta. OpenAI on ilmoittanut, että se on suurelta osin koulutettu länsimaiseen musiikkiin, mikä edustaa selkeää harhaa siinä, mitä musiikkia se pystyy tuottamaan.
Mitä voit tehdä Jukeboxilla?
Joten, ottaen huomioon sen rajoitukset, mitä voit tehdä Jukeboxilla? Nopea tapa vastata tähän kysymykseen on sanoa, mitä et voi tehdä Jukeboxilla.
Koska yhden minuutin musiikin toisto kestää lähes puoli päivää, se ei ole kovin hyödyllinen musiikin tuottamiseen. Ei ainakaan perinteisessä mielessä. Normaalisti muusikot liikkuvat edestakaisin instrumentilla soittamisen (improvisoinnin) ja kappaleen rakenteen suunnittelun välillä. Samanlainen kokeilu ei ole mahdollista Jukeboxin kanssa.
Koska tässä vaiheessa ei ole helppoa tehdä kappaletta Jukeboxilla, voit ajatella sitä enemmänkin uutena tapana luoda musiikkinäytteitä. Kun olet luonut haluamasi äänen, voit käyttää sitä luovissa projekteissasi tavalliseen tapaan.
Alla oleva video on seurausta siitä, että joku käyttää Jukeboxilla luotua musiikkia alleviivatakseen lyhyttä montaasivideota.
Tekoälyllä on laaja valikoima sovelluksia myös luovien sovellusten ulkopuolella, minkä vuoksi se kannattaa ymmärtää mitä tekoäly on ja sen aiheuttamat vaarat.
Kiinnostaako sinua tekoälymusiikki?
Jukeboxin luomaa musiikkia ei ole helppo hylätä, ja kaikesta ouduudestaan ja aavemaisesta ihmis-kone-laadustaan huolimatta se kuulostaa lopulta musiikilta. Vaikka musiikkiteollisuus on käyttänyt tekoälytyökaluja jo jonkin aikaa, mahdollisuus tuottaa musiikkia raakaäänenä on vasta nyt todellisuutta.
Mutta vaikka Jukeboxin kaltaiset mallit ovat olemassa, niitä ei ole vielä pakattu kaupalliseen työkaluun, eivätkä ne silti riitä ihmismuusikoiden kykyihin.