Tämä on tositarina – ja oikeastaan seikkailu. Se kiehtoi, turhautti, masensi, riemastutti ja ehkä vähän harhauttikin. Barking Mad – Forged In Fire Destined For Glory
Johdanto
Olen soittanut bändeissä siitä asti, kun 13-vuotiaana isältä ruinaamani instrumentti ilmestyi kotiin.
Graafikon urakin lähti käyntiin enemmän tarpeesta kuin suunnitelmasta: rahattomina teineinä piti tehdä itse julisteet ja logot. Siitä asti harrastus ja työ ovat lomittuneet, enkä ole menettänyt intohimoani kumpaankaan.
Ehkä juuri tällaiset tempaukset pitävät mielenkiinnon yllä.
Mutta se minusta. Sinua kiinnostaa keinoäly, ja ehkä musiikkivideon tekeminen omalle bändille. En tietenkään aio estää sinua, mutta kannattaa nyt lukea loppuun kuitenkin, ennen kuin sukellat siihen maailmaan.
Lupaan, että naurat. En vain tiedä, onko sinulla enää hauskaa, jos tarkoituksesi on oikeasti tehdä musiikkivideo.
Bändini nauroi, kun ehdotin AI-coveria
Olimme juuri saaneet valmiiksi kappaleen Bara, bada Bastu.
Ruotsalainen Tommy Johansson oli tehnyt siitä YouTubeen heaviversion, ja uteliaana klikkasin katsomaan, mitä muuta hän oli tehnyt. Kävi ilmi, että hän on Sabatonin entinen kitaristi ja nykyisin veivaa power metalia omalle bändilleen.
Biisit olivat loistavia, mutta samalla sisälläni nakutti ajatus: tämähän on niin perhanan geneeristä, että juuri tähän keinoäly sopisi täydellisesti.
Parhaimmillaan power metal on virtuoosin lelukauppa, pahimmillaan kliseiden kopiointikone.
Olin kirjaimellisesti kitaralla shredaava graafinen suunnittelija – jos joku pystyi tekemään AI:lla hyvän power metal -videon, sen täytyi olla minä.
Mielessäni pyöri jo visioita eeppisistä maisemista ja lohikäärmeistä. Kuinka vaikeaa se muka voisi olla?
Halusin parodiaa, sain hitin!
Pyysin ChatGPT:tä kirjoittamaan minulle geneerisimmät mahdolliset power metal -lyriikat. Ja kas kummaa – se onnistui kerrasta! Teksti oli niin täydellinen parodia, että tuntui kuin tekoälykin olisi oikeasti ymmärtänyt sarkasmiani ja nauranut kanssani.
Olin aivan haltioissani. Syötin sanat Sunolle ja kirjoitin kuvaukseen vain: “power metal, symphonic power metal”. Ei mitään muuta.
Suno raksutteli kaksi versiota, ja molemmat olivat laakista niin hyviä, että valinta oli oikeasti vaikea. Lopulta valitsin mielestäni paremman ja lähetin sen veljelleni Topille chatissa. Esittelin biisin ensin varovasti: ”Tämä on tämmöinen pieni parodia, Suno teki.”
Topi, joka inhoaa jo ajatustakin tekoälystä, on kuitenkin soittanut power metal -yhtyeessä.
Hän ei siis heti tuominnut kappaletta. Tämä olisi pitänyt olla varoitusmerkki numero yksi, mutta kuulin siinä vain kehun ja rohkaistuin kertomaan ideani bändille: tehdään AI-cover. Ja tehdään sille myös AI-musiikkivideo.
”Tästä tulee myötähäpeän multihuipentuma. Mutta myös eeppisin teos, mitä meillä on koskaan ollut.”
Sampsa saapui reenikselle tapansa mukaan myöhässä, juuri kun esittelin kappaletta. Hän kysyi: “Mitäs tämä on? Kuulostaapa hyvältä.”
Tämä taisi murtaa padon. Sain kuin sainkin bändin innostumaan.
Tässä kohtaa olin vielä suloisen tietämätön, millaiseen suohon olin juuri yllyttämässä meitä kaikkia. Minulla oli kaikki syy uskoa onnistumiseen. Minulla oli bändi mukana, biisi valmis ja teknologia taskussa.
AI:n mainospuheet menivät minuun kuin kuuma veitsi voihin. Democratized creativity! Anyone can make Hollywood-quality content! The future is here!
Tämä olisi pitänyt olla varoitusmerkki numero kaksi, mutta näin siinä vain täydellisen ajoituksen.
En ollut saanut oikein nukuttua kunnolla, ja heikkona hetkenä aloin hieman epäröidä itseäni aamulla. Onko tämä idea täysin typerä? Entä jos olen itse asiassa se tyyppi, joka luulee osaavansa, mutta ei osaakaan?
Katsoin peiliin ja näin hieman rikkinäisen näköisen graafikon, joka oli luvannut tehdä jotain, mistä ei tiennyt mitään. Klassinen maanantaiaamun katumuksen hetki, jolloin lauantain nerokkaat ideat kuulostavat äkkiä aivan järjettömiltä.
Halusin, että joku repii ideani kappaleiksi , mutta hän liittyikin projektiin
Kaipasin idealleni ulkoista vahvistusta. En halunnut olla se tyyppi, joka innostuu uusista työkaluista niin palavasti, että raahaa muut mukaan projektiin, jossa ei ole toivoakaan. Tiedän sellaisia ihmisiä. He ovat ärsyttäviä.
Olin epävarma: oliko arvostelukykyni sokaistunut? Onko tämä sama illuusio kuin kun katselee omia vanhoja töitään ja luulee niiden olevan hyviä, kunnes näkee ne viikon kuluttua?
Päätin tehdä jotain tyhmää ja soittaa kappaleen Sami Auraselle.
Tämä oli kuin hakea terapiaa psykopaatilta. Sami on monen kultalevyn tuottaja – ja mielipiteissään suorin, kylmäviileän rehellinen ihminen, jonka tunnen. Hän on se tyyppi, joka sanoo suoraan, jos musiikki on paskaa. Ei hienottelua, ei kohteliaisuutta, ei ”hyvä yritys” -heittoja.
Ajattelin, että jos joku pistää minut ojennukseen, se on Sami.
Soitin Samille. ”Moi, mulla on tämmönen juttu…” selitin, ja kerroin koko idean AI-musiikkivideoineen. Hiljaisuus puhelun toisessa päässä tuntui tunneilta.
Olin jo valmis kuulemaan tuomion, kunnes Sami kysyi: ”Onko sulla se biisi siinä?” ”On.” ”Lähetä se mulle.” Lähetin, ja odotin. ”Mitä mieltä olet?” kysyin myöhemmin WhatsAppissa. ”Se on hyvä,” Sami sanoi lyhyesti. ”Se on oikeasti vitun hyvä. Mä voin tuottaa sen.”
Olin shokissa. Tässä kohtaa minun olisi pitänyt tajuta, että maailmankaikkeus pelaa minua vastaan. Kun etsit särkynyttä peiliä, löydät vain kiillotettua lasia. Kun haluat, että joku pysäyttää sinut, he sen sijaan antavat kaasua.
Sain kovan vahvistuksen tiimiin. Kerroin toki, ettei biisiä muutettaisi ja että musiikkivideo tulisi olemaan myötähäpeän multihuipentuma, jossa keski-ikäiset miehet leikkivät fantasiahahmoja.
Silti Sami halusi mukaan.
”Kuulostaa hauskalta,” hän sanoi.
Jos Sami lähtee mukaan, tiedän, etten ole ihan hakoteillä. Hän on se ihminen, joka sanoo asiat suoraan – ja nyt hän sanoi: ”tää tehdään”.
Lentolupakirja ilman lentotunteja
Tämä oli se vahvistus, jonka tarvitsin.
Voin olla itse uhkarohkea omien projektien kanssa, mutta toisten raahaaminen omiin kotkotuksiin ei ole cool. Nyt en raahannut ketään – he tulivat itse.
Tämä hybris oli kuin olisin saanut lentolupakirjan ilman ainuttakaan lentotuntia, ja nousin itsevarmana ohjaamoon. Wow, mitä nappuloita!
”This is your captain speaking: olen katsonut YouTubesta tutoriaalit, nyt mennään.”
Matkustajat taputtivat. lennonjohto antoi luvan nousuun. Kukaan ei kysynyt, osaanko edes käynnistää moottoreita.
Sisälläni kasvoi hurmaava tunne vääjäämättömyydestä. Nyt ei ollut enää paluuta. Olin saanut liian paljon tukea peruakseni. Bändi oli innoissaan, tuottaja oli mukana, ja minä olin lupaillut mahdottomia.
Tämä oli se hetki, jolloin kohtaloni sinetöitiin – en vain tiennyt sitä vielä.
Kaikki loksahtelee paikoilleen – liian helposti
Biisi itsessään oli haastava, mutta olin ällistynyt siitä, kuinka uskomattoman oikean kuuloisia sweep-arppeggioita tekoäly oli loihtinut. Opin itse uusia juttuja lennosta ja sain nauhoitettua jopa kaikista hankalimmat ideat hämmästyttävän vaivattomasti.
Olo oli kuin jonkun salaisen portin löytäneellä: homma, joka normaalisti hikoiluttaa minua kuukausia, syntyi nyt minuuteissa – täysin itsestään.
Liian hyvää ollakseen totta, mutta miksi kysyä miksi?
Sampsa joutui basareiden kanssa hieman koville. Hän on meidän luottopelaaja, mies, joka ei ole vielä koskaan horjahtanut yhdessäkään kappaleessa. Nyt ensimmäistä kertaa hän ei ollut tyytyväinen ensimmäisiin ottoihinsa.
Sampsa on laskettelija, mutta silti jalat kramppasivat, kun basarit laukkasivat tauotta.
”Vittu mikä biisi,” hän mutisi hikoillen. Tämä olisi pitänyt olla varoitusmerkki numero kolme, mutta kuulin siinä vain kehun.
Toinen sessio kuitenkin toi läpimurron, ja samalla Samin uusi rumpumikitys soi niin perhanan upeasti, että tuntui kuin koko reenikämppä olisi muuttunut miljoonan taalan studioksi.
Tuottajamme Sami hoiti miksauksen ja masteroinnin myös ennätysajassa. Jokainen osa loksahti paikalleen kuin näkymättömän käden ohjaamana. Olimme yhtäkkiä tilanteessa, jossa mikään ei voinut mennä pieleen. Olin varma: tästä tulee jotakin isoa.
Jaoin Samin miksaaman biisin WhatsAppissa ja reaktiot bändiltä olivat pelkkiä tuli-emojia ja wow-naamoja.
Nyt tarvittiin enää yksi asia – musiikkivideo.
Ensimmäiset pilvet, tai pikemminkin ukkospilvien kehittyminen
Suunnitelma mielessäni oli kirkas: yhdistelen bändin jäsenet Kling AI -ohjelmalla keinoälyn tuottamaan maisemaan. Katsoin tutoriaaleja ahkerasti YouTubesta ja uskoin olevani kartalla.
Kuvattuani Topin olin suunnitellut lisääväni asusteet Photoshopilla ja antavani tekoälyn hoitaa loput. Sehän ei tietenkään toiminut alkuunkaan. Tuloksena oli käsittämätöntä digisillisalaattia – tästä video alla.
Istuin työtuolissani kello 2 yöllä, katsoin ruudulta groteskeja luomuksia ja mietin: ”Miten ihmeessä selitän Topille, että hänen alter egonsa on sammakko-ihmishybridi?”
Hevosten jalat ja filosofiset kysymykset
Kun pitkään hiottu prompt valui hitaasti ruudulle, painoin play… ja näin hevosen juoksevan jalat jalustimilla – mutta ilman koko muuta ruumista. Siinä kohtaa uskoni romahti. ”Ei tällä tee yhtään mitään,” mutisin itsekseni ja katsoin kellon.
Taas neljä tuntia elämääni meni hukkaan. Neljä tuntia, jolla olisin voinut tehdä työtä, josta tiedän jotain. Ei kyse ollut siitä, että tulos oli huono. Se oli surrealistisen absurdi tavalla, joka ei ollut edes huvittava. Kello on 06:00 ja kympiltä palaveri, nyt pitää päästä nukkumaan.
Päätin kuitenkin ensiksi lopettaa KlingAI-tilauksen.
Siinäkin törmäsin dark pattern -designiin: 20 minuuttia klikkailua, eikä unsubscribe-nappia missään. Jokainen linkki johti uuteen labyrinttiin, johon oli piilotettu vielä uusia ansoja. Menisi hermot, jos ne eivät olisi menneet jo aikaa sitten.
Onneksi keinoäly osasi auttaa minua edes löytämään sen halvatun sivun, mistä pääsin perumaan tilauksen. Vihdoinkin nukkumaan.
Ensimmäistä kertaa projektin alusta alkaen ajattelin, että ehkä tämä oli virhe.
Plan-B: Green Screen + AI
Koska alkuperäinen strategia hajosi käsiin, päätin ottaa vielä yhden ylimääräisen riskin.
Uskoin, että pystyin ehkä yhdistelemään tekoälyklippejä ja green screen -kuvausta, mikä antaisi minulle enemmän kontrollia.
Tämä oli klassista gambler’s fallacy -ajattelua: kun häviät pokerissa, nostat panoksia ja pelaat vielä hullummin.
Ajattelin rakentaa Topille cosplay-haarniskan itse, kun en kerran saa sitä Topin päälle keinoälyn avulla. Jos teknologia pettää, palataan takaisin kivikauteen – käsitöihin.
Jo 15 minuutissa totesin, että tämä oli monumentaalinen virhe.
Ajattelin liimailla haarniskan kasaan netistä lataamillani ohjeilla, ja haarniska olisi valmis ennen kuin muu perhe tulee asioilta kotiin.
Edessäni oli pöytä täynnä EVA-vaahtoa, liimapyssy ja Dremel-sahoja. Olohuoneessa haisi kemikaaleilta niin pahasti, että kissa ei suostunut terassilta sisälle edes ruokakuppia kilistämällä. Lattialla oli leikattuja palasia kaikkialla, ja minä seisoin keskellä sitä kaaosta tajuten, etten tiedä mistään mitään.
Mietin sen kuitenkin niin, että kun kerran tavarat oli hankittu, kämppä haisi liimalle ja olohuone muistutti kaatopaikkaa, ei ollut enää paluuta.
Sunk cost fallacy parhaimmillaan – tai pahimmillaan.
Teeskentelen perheelle olevani ammattilainen
Näyttelin perheelle, että tiesin mitä olin tekemässä.
”Joo ei tässä mitään erikoista ole, rakennetaan vaan pieni haarniska,” sanoin rennosti, kun vaimo nuuhkaisi huolestuneena kemikaalipilveä, joka leijui olohuoneessa.
Totuus: cosplay-asusteen teko ei ole helppoa tai nopeaa – eikä varsinkaan halpaa, vaikka se YouTubessa näyttää kivalta askartelulta. Kaksi viikkoa ja 150 euroa materiaaleihin myöhemmin aloin tajuta, että olin ajautunut täysin väärille vesille.
Kun näin Lordin tekevän asunsa itse, ajattelin: ”How hard can it be?”
Graafikkona minun pitäisi hallita visuaalinen kerronta, mutta tässä en saanut edes jumppamatosta muovattua simppeliä haarniskaa. Tämän olisi pitänyt olla neljäs varoitusmerkki.
Ensimmäinen olkapää näytti siltä kuin nuorempi kissamme olisi hävinnyt taistelun ilmastointiteipin kanssa.
Toinen olkapää oli nopeampi tehdä. Niin. Siinä kaikki, mitä minulla on siitä kerrottavaa.
Noh. Nyt osaan arvostaa Tomi Putaansuuta hyvin, hyvin korkealle.
Knoppitieto:
Sami Auranen, joka on ollut Lordin taustajoukoissa, kertoi minulle kerran tapauksesta, jossa Tomi Putaansuu sai työtarjouksen elokuvapuolelta – Hollywood-tasoiselta tuotannolta – niin paljon hänen asuosaamistaan arvostettiin.
Tomi ei siis ole mikään kylähullu, joka liimapyssyn kanssa askartelee, vaan kansainvälisesti tunnustettu ammattilainen.
Ja minun haarniska? Say no more.
Nyt olin tilanteessa, jossa en ollut oikeastaan edes aloittanut kunnolla, ja silti olin jo kyynärpäitä myöten suossa.
Tuottaja kyseli tasaisin väliajoin, koska video valmistuu. ”Miten se etenee?” tuli viesti WhatsAppiin. Minä puolestani tarjosin epämääräisiä, mutta aina toiveikkaita vastauksia:
”Joo, hyvää edistystä! Pari teknistä säätöä vielä.” ”AI-mallissa oli päivitys, nyt pitäisi mennä paremmin.” ”Testaan yhtä uutta työkalua, näyttää lupaavalta.”
Klassinen projektimanagerin valheenpyörre – kun totuus on liian nolo myönnettäväksi, valehtelet optimismia, kunnes todellisuus tulee vastaan sitten joskus.
Midjourney – väärä toivo oikeaan aikaan
Sattumalta Midjourney julkaisi juuri silloin oman videomallinsa.
Uskoni palasi! Tämän olisi pitänyt olla viides varoitusmerkki – kun maailmankaikkeus antaa sinulle täydellisen ajoituksen, se on tavallisesti ansa. Tämä oli kuitenkin minun luottomallini kuvituksissa, joten ajattelin: nyt tästä tulee hauskaa.
No, tuli ja ei tullut. Midjourney osaa tuottaa hienoja yksittäisiä kuvia, mutta konsistenssi on toinen juttu.
Kokeiluja tuli liukuhihnalta, ja ennen kuin huomasin, olin taaskin kuluttanut kuukausittaiset krediitit loppuun ja ostin niitä vielä lisääkin. Uudetkin krediitit kuluivat loppuun about puolessa tunnissa.
Alla hallusinoiva Midjourney-video, jossa hevoset eivät tiedä, kumpaan suuntaan menevät.
Silti sain jonkinlaisen alun aikaiseksi, ja Midjourney tuotti paljon hyviäkin klippejä. Harmillisesti resoluutio oli vain 480p. Mitä minä sillä teen, kun minulla ei ole ollut VHS-nauhuriakaan kahteenkymmeneen vuoteen?
Jokainen klippi piti vielä uittaa Topaz Video AI:n kautta.
Sekään ei ihmeisiin pystynyt, ja ylimääräinen upscale-työvaihe söi aikaa ja hermoja. Sain kuitenkin yhdisteltyä taustoja ja green screen -kuvausta, joten harjoitus oli osittain tuloksellinen.
Alkaa hahmottua, miten tämä leikki menee. Oli aika todeta, että myös Midjourney oli vasta kokeellinen julkaisu. Tulokset olivat tavallaan lupaavia, mutta en nähnyt reittiä maaliin asti. Taas oli pakko kokeilla uutta alustaa.
Prinsessat ja lohikäärmeet tulevat olemaan koko videon vaikuttavin elementti, pakko keksiä jotain ja äkkiä.
Sisälläni alkoi herätä epäilys: ehkä nämä AI-videot, jotka olin nähnyt somessa, olivat cherry-pickattuja parhaita tuloksia? Ei, ei se niin voi olla, sehän olisi huijaamista.
Kahlasin taas yöt läpi tutoriaaleja ja arvioita, kunnes päädyin LumaAI:hin – paljon kehuttuun tulokkaaseen.
Käyttöliittymä näytti slickiltä, ja uskoin, että nyt vihdoin olin löytänyt oikean alustan. Ja mikä parasta: full HD -laatu!
Voi kuinka väärässä olinkaan. Alla oleva video kertoo enemmän kuin sanoilla voin kauhistella: kökkötraktori hirveimmillään.
Tässä vaiheessa mieli kävi jo todella syvällä.
Jos nämä kaikki työkalut ovat tällaisia, en tule selviämään tästä projektista.
Olin luvannut itselleni – ja kaikille muille – että tekisimme jotain todella siistiä.
Lähetin WhatsApp-kanavalle kuvakaappauksia ja yritin kuulostaa innostuneelta: ”Tässä pientä edistystä! Vielä muutama säätö…” ”AI kehittyy koko ajan, kohta saadaan tämä maaliin!”
Minua oikeasti hävetti, että olin järjestänyt tällaisen shit show’n, ja tuloksena oli vain kasa digitaalista roskaa ja puolikas haarniska, joka muistutti enemmän roskakoria kuin panssaria.
Kaikki muut ympärilläni olivat suoriutuneet: Sampsa oli opetellut mahdottomat basarit. Topi oli kärsinyt kärsivällisesti green screen -sessioita. Sami oli tehnyt upeaa tuotantotyötä.
Minusta taas oli kiinni, miten tästä noustaan – ja juuri nyt olin täysin onneton.
Tämä oli alhaisin hetkeni musiikin parissa.
Viimeinen oljenkorsi, tai viimeinen naula arkkuun
Sattumalta vaihdoin muutaman sanan AI:sta Janne Aaltosen kanssa. Hän on touhunnut musiikin ja tekoälyn parissa paljon enemmän kuin minä, ja ajattelin, että jos jollain, niin hänellä voisi olla rohkaisun sana tai jopa ratkaisu.
En tietenkään kehdannut kertoa, millaisessa liisterissä olin juuri sillä hetkellä. Valitettavasti hänen kommenttinsa ei ollut ihan balsamia haavoille:
“Jos säätää kolme vuorokautta putkeen ja laittaa 200 € krediitteihin, voi saada jotain kökköpaskaa ihan tosta noin vaan.”
Se oli totuus.
Mutta Janne vinkkasi kuitenkin kokeilemaan VEO 3 -versiota. Tiesin sen olevan kehuttu ja olin nähnyt hienoja näytteitä, mutta totta puhuen – hienoja näytteitä olin nähnyt jokaisessa mallissa.
Lisäksi VEO 3 oli kallis, monta kertaluokkaa kalliimpi kuin mikään muu kokeilemani.
Mutta minustapa oli tullut kuin päihderiippuvainen, joka uskoo, että seuraava annos on se, joka korjaa kaiken, joten taas mentiin.
Maailmankaikkeus heittää viimeisen ässän hihasta
Selvitellessäni asiaa huomasin kuitenkin, että VEO oli juuri tullut palveluun, johon minulla oli ollut subscription jo vuosia.
Kuin tilauksesta!
Tämä ei voinut olla sattumaa. Maailmankaikkeus oli leikinyt minua vastaan koko projektin ajan, mutta nyt se antoi minulle viimeisen mahdollisuuden.
Tämä oli viimeinen suuri videomalli – muita vaihtoehtoja ei enää yksinkertaisesti ollut.
Koska olin jo tehnyt valtavan määrän harjoituksia, olin kehittynyt promptaamisessa.
Tiesin nyt tarkasti, mitä halusin, ja rehellisesti: minulla ei ollut varaa epäonnistua. Käytin kaiken jäljellä olevan ajan ja tarkkuuden varmistaakseni, että prompti olisi täydellinen.
Painoin enter.
Ja sitten… odottaminen alkoi.
Ja sitten – siinä se oli. Ei ole todellista.
Ensimmäinen video oli paras koskaan tekemäni, aivan ylivoimaisesti. Tein heti toisen perään ja varmistin, että promptissa oli kaikki parametrit tunnelman säilyttämiseksi. Se oli melkein parempi kuin edellinen.
Nyt minulla oli vihdoin rohkeutta todeta ääneen: kaikki aiempi joutaa roskiin.
Nyt tästä todella nousee se musiikkivideo.
Minulla oli vihdoin kaikki palaset kasassa, jopa credittejä riitti vielä, jos halusin vaihtaa kohtauksia viime hetkillä.
Niin teinkin. Halusin lisätä alkuun klassisen kauhuelokuvien ja jännäreiden ”aerial establishing shot” -droneajon, joka antaa katsojalle heti tuntuman lokaatiosta. Sekin onnistui täydellisesti.
Lisäsin vielä pari ukkosen jyrähdystä ja lohikäärmeen örähtelyä. Päälle sumua ja sadetta lähes jokaiseen klippiin, jotta videon jatkumo tuntuisi yhtenäiseltä.
Värikorjauksia tuli tehtyä kasapäin, mutta se on yksi mieluisimmista työvaiheistani – niin mieluisa, etten huomannutkaan ajan kulua.
Valmis?
Katsoin videon läpi monta kertaa. Biisi kesti toistoa, joten sen oli pakko olla oikeasti ihan ok kappale.
Mielessäni kaikui vielä Samin kylmä, totuudenmukainen ääni: ”Se on vitun hyvä.” Tiesin, että se oli totta.
Mielessäni pyöri vain kysymys: tässäkö se nyt on – onko tämä valmis?
Laitoin videon bändin WhatsApp-ryhmään aamuyöstä kommentoitavaksi ja menin nukkumaan.
Varoittelin etukäteen, että loppukohtaus on mauttomuuden multihuipentuma ja vähän lapsellinenkin siihen päälle. Silti olin toiveikas – juuri sellaista videotahan me tässä oltiin tekemässä.
Aamulla vastauksia alkoi tulla bändikavereilta:
- ”Hyvä Junnu hyvä Junnu hyvä Junnu!!! 🎉🎉🎉”
- ”Mitä julmettua! 🤯 Törkeen kova”
- ”On se kyl komia, onks tää nyt valmis eetteriin? 🔥”
- ”Huikee 🤘”
Myös tuottajamme Sami laittoi tapansa mukaan lyhyen, ja hänen mittapuullaan tunteikkaan ja herkistyneen palautteen suoraan sydämestä.
- ”😂 Ihan vitun kova!”
Olin onnistunut. Tälläinen palaute kaiken tämän jälkeen tuntui hienolta, en voi sitä kiistää.
Kun lopulta katsoin kokonaisuuden, saatoin todeta: video onnistui paremmin kuin pelkäsin – ja yhtä hyvin kuin olin pitänyt mahdollisena sen perusteella, mitä olin seurannut aihetta.
Teknologia se vain karkaa jatkuvasti alta
Tekoäly kehittyy nyt niin valtavaa vauhtia, että jos tekisin videon uudestaan tänään, olisin täysin varma, että siitä tulisi parempi.
Jopa kuukausi tuntuu pitkältä ajalta, huomio on jo selvästi siirtynyt kuvista videoon, ja videot tulevat kehittymään jatkossa yhtä suurella vauhdilla kuin kuvat tähän asti.
Tämänhetkinen suurin haaste videoiden luomisessa tekoälyllä on koherenttius ja johdonmukaisuus. Kuten tarinassani huomasit, mallit kamppailevat saman hahmon, esineen tai ympäristön pitämisessä samanlaisena eri klippeissä.
Jokainen yksittäinen klippi saattaa näyttää fantastiselta, mutta kokonaisuus on usein digitaalista ”sillisalaattia”. Tämä johtuu siitä, että mallit luovat pikseli kerrallaan seuraavan ruudun, eivätkä ne vielä ymmärrä syvällisesti fysiikkaa, valaistusta tai hahmojen pysyvyyttä.
Tämän seurauksena hahmojen muodot, asut ja valaistus muuttuvat odottamattomasti, ja esineet saattavat ilmestyä tai kadota.
Alla aiemmin mainitsemani video, jossa ratsastajan jalat näkyvät, mutta kuvakulman muuttuessa itse ratsastaja puuttuu.
Toinen merkittävä puute on hallittavuus. Vaikka promptit ovat kehittyneet, tarkka ohjaus on edelleen haastavaa.
Onneksi nämä ongelmat ovat tunnistettuja, ja ala kehittyy nopeasti niiden ratkaisemiseksi.
Kehitys on siirtymässä pois pelkästä generatiivisesta kuvien ja videoiden luomisesta kohti monimutkaisempaa simulaatiota ja ennakoitavuutta.
Tulevaisuudessa odotettavissa on kolme merkittävää parannusta:
- Parannettu koherenttius: Tulevat mallit muistavat ja ylläpitävät hahmojen ja ympäristöjen johdonmukaisuutta klipistä toiseen. Mallit eivät enää luo vain seuraavaa kuvaa, vaan ne ymmärtävät, miten kohde liikkuu ja muuttuu tilassa. Tämän myötä haluttu visio säilyy paremmin.
- Tarkempi hallittavuus: Ohjaustyökalut, kuten ControlNet, kehittyvät jatkuvasti. Ne mahdollistavat videoiden luomisen esimerkiksi luonnosten, liikeratojen tai syvyyskarttojen pohjalta. Tämä tarkoittaa, että voit antaa tekoälylle tarkempia ohjeita siitä, mitä haluat nähdä, mikä vähentää arvailuasi ja lisää ennakoitavuutta.
- Nopeus ja tehokkuus: Pilvipalveluiden, kuten Googlen VEO-mallin, saavuttavuus paranee ja hinta laskee. Tämä tekee nopeiden testien tekemisestä edullisempaa ja vaivattomampaa. Lyhyemmät rendering-ajat ja intuitiivisemmat käyttöliittymät poistavat turhaa työtä ja turhautumista.
Jos siis mietit, milloin on hyvä aika tehdä oma musiikkivideosi tekoälyllä, vastaan rehellisesti: ei vielä vuonna 2025.
Ei siksi, etteikö se olisi mahdollista nytkin, vaan siksi, että vuoden päästä kokemus on todennäköisesti mielikuvituksellisempi, yhtenäisempi ja ennen kaikkea vähemmän hermoja raastava.
Video on ollut nyt ulkona kuukauden. Katseluita on kertynyt vähemmän kuin normaalisti, eikä ainoatakaan kommenttia ole ilmestynyt YouTubeen. Facebookissa joku kehui meitä rehellisyydestä, mutta toisaalla moitittiin: “Miksi julkaista, että biisi on AI? Sehän on hyvä biisi.”
Osasin odottaa ristiriitaista vastaanottoa. Joten se on minulle ihan ok.
Tekoäly jakaa toki mielipiteitä vielä pitkään
Kuten kaikessa uudessa, ensin kauhistellaan, sitten taistellaan vastaan, ja lopulta uusi teknologia voittaa. Miksi tämä olisi poikkeus?
Tulevaisuudessa emme luultavasti edes mieti, onko kappale tehty tekoälyllä vai ilman, aivan kuten emme mieti, millä tekniikalla kappale on äänitetty tai miksattu.
Kukaan ei nykyään ajaessa mieti, millä tekniikalla tai työryhmällä auton radiosta kuuluva biisi on tuotettu.
Jo nyt musiikkia luodaan suurissa työryhmissä, joissa tekijöitä voi olla enemmän kuin sanoja kappaleessa. Tekoäly on seuraava looginen askel tässä kehityksessä.
Keinoäly on uusi työkalu, joka tulee lopulta sulautumaan osaksi tuotantoprosessia, aivan kuten Auto-Tune tai muut äänitystekniikat ovat muuttuneet alan standardiksi.
Silti toivon – ja uskonkin – että tekoälyn rinnalle nousee vasta-aalto. Että improvisaatio, live ja aitous kapinoivat vastaan.
Olen varma, että lopulta kummallekin, ihmisen luovuudelle ja tekoälylle, löytyy oma tila musiikin maailmasta.
Kiitokset työryhmälle
Vaikka tämä tarina on kerrottu minun perspektiivistäni, video on ollut koko työryhmän yhteinen ponnistus.
Teppo Tirkkonen – ääninäyttelijä
Sami Auranen – tuottaja
Sampsa Ylönen – rummut
Pasi Toukola – basso
Topi Vuorela – laulu & kitara
Junnu Vuorela – kitara
Jos olet suunnittelemassa omaa AI-musiikkivideota, harkitse ensin, haluatko todella käydä tämän saman polun. Ammattilaisen palkkaaminen voi olla halvin ratkaisu.
Jos taas mietit yrityksellesi verkkosivuja — siitä minulla on paljon parempia kokemuksia.
Ota yhteyttä, niin selvitetään, miltä se voisi oikeasti näyttää.



