Google julkistaa Veon ja Imagen 3:n, uusimmat tekoälyn medianluontimallit | Cilostazol

Google julkistaa Veon ja Imagen 3:n, uusimmat tekoälyn medianluontimallit

Kaikki on tekoälyä koko ajan Google I/O:ssa! Google julkisti tänään uudet AI-medianluontimoottorinsa: Veo, joka pystyy tuottamaan “korkealaatuisia” 1080p-videoita; ja Imagen 3, sen uusin tekstistä kuvaksi -kehys. Mikään niistä ei kuulosta erityisen vallankumoukselliselta, mutta ne ovat tapa Googlelle jatkaa taistelua OpenAI:n Sora-videomallia ja Dall-E 3 -työkalua vastaan, josta on käytännössä tullut tekoälyn luomien kuvien synonyymi.

Google väittää, että Veolla on “edistynyt ymmärrys luonnollisesta kielestä ja visuaalisesta semantiikasta” luodakseen mielessäsi olevan videon. Tekoälyn luomat videot voivat kestää “yli minuutin”. Veo pystyy ymmärtämään myös elokuvallisia ja visuaalisia tekniikoita, kuten timelapse-käsitettä. Mutta sen pitäisi todella olla pöytäkone tekoälyvideon sukupolvimallille, eikö niin?

Osoittaakseen, ettei Veo aio varastaa taiteilijan työtä, Google on tehnyt yhteistyötä Donald Gloverin ja hänen luovan studionsa Gilgan kanssa esitelläkseen mallin kykyjä. Hyvin lyhyessä mainosvideossa näemme Gloverin ja miehistön luovan tekstiä videon avoautosta, joka saapuu eurooppalaiseen kotiin, ja purjeveneestä, joka liukuu valtameren halki. Googlen mukaan Veo pystyy simuloimaan todellisen maailman fysiikkaa paremmin kuin aiemmat mallinsa, ja se on myös parantunut, miten se tuottaa teräväpiirtomateriaalia.

“Kaikki haluavat olla ohjaajia, ja kaikkien pitäisi olla ohjaajia”, Glover sanoo videossa, jossa hän ansaitsee ehdottomasti Google-palkkansa. “Kaiken tämän ytimenä on vain tarinankerronta. Mitä lähemmäksi pääsemme kertomaan tarinoita toisillemme, sitä paremmin ymmärrämme toisiamme.”

Nähtäväksi jää, katsooko kukaan todella tekoälyn luomaa videota sen sairaalloisen uteliaisuuden lisäksi, että kone yrittää luoda algoritmisesti uudelleen ihmistaiteilijoiden töitä. Mutta se ei estä Googlea tai OpenAI:ta mainostamasta näitä työkaluja ja toivomasta niistä olevan hyötyä (tai ainakin tienaamasta paljon rahaa). Veo on saatavilla Googlen VideoFX-työkalussa joillekin sisällöntuottajille tänään, ja yritys sanoo, että se tulee myös YouTube Shortsiin ja muihin tuotteisiin. Jos Veo päätyy YouTube Shortsien sisäänrakennetuksi, se on ainakin yksi ominaisuus, jonka Google voi hallita TikTokin kautta.

Google IO 2024

Google

Mitä tulee Imagen 3:een, Google tekee tavanomaiset lupaukset: Sen sanotaan olevan yrityksen “korkein laatu” tekstistä kuvaksi -malli, jossa on “uskomattoman yksityiskohtaiset tasot” “fotorealistisille, todenmukaisille kuville” ja vähemmän esineitä. Todellinen testi on tietysti nähdä kuinka se käsittelee kehotteita verrattuna Dall-E 3:een. Imagen 3 käsittelee tekstiä paremmin kuin ennen, Google sanoo, ja se on myös älykkäämpi käsittelemään pitkien kehotteiden yksityiskohtia.

Google tekee myös yhteistyötä levytaiteilijoiden, kuten Wyclef Jeanin ja Björnin, kanssa testatakseen Music AI Sandbox -työkalua, joka voi auttaa luomaan kappaleita ja biittejä. Näimme vain lyhyen välähdyksen tästä, mutta se on johtanut muutamiin jännittäviin demoihin:

Aurinko nousee ja laskee. Me kaikki kuolemme hitaasti. Ja tekoäly tulee älykkäämmäksi päivä päivältä. Se näyttää olevan suuri poiminta Googlen uusimmista medianluontityökaluista. Toki ne paranevat! Google kaataa miljardeja tehdäkseen tekoälyn unelmasta totta, kaikki tavoitteenaan omistaa seuraava suuri harppaus tietojenkäsittelyssä. Tekeekö mikään näistä todella elämästämme paremman? Pystyvätkö he koskaan luomaan taidetta aidolla sielulla? Tarkista Google I/O:ssa joka vuosi, kunnes AGI todella ilmestyy tai sivilisaatiomme romahtaa.

Seuraa kaikkia Google I/O 2024 -uutisia heti tässä!

Leave a Reply

Your email address will not be published. Required fields are marked *