Google esittelee Veon, teräväpiirtotekoisen tekoälyvideogeneraattorin kilpailija Soralle | Cilostazol

Google esittelee Veon, teräväpiirtotekoisen tekoälyvideogeneraattorin kilpailija Soralle
Suurentaa / Google Veon luomista videoista otettuja still-kuvia.

Google / Benj Edwards

Google ilmoitti tiistaina Google I/O 2024:ssä Valitettavasti, uusi AI-videosynteesimalli, joka voi luoda HD-videoita tekstistä, kuvasta tai videokehotteista, kuten OpenAI:n Sora. Se voi tuottaa yli minuutin kestäviä 1080p-videoita ja muokata videoita kirjallisten ohjeiden perusteella, mutta sitä ei ole vielä julkaistu laajaan käyttöön.

Veon kerrotaan sisältävän mahdollisuuden muokata olemassa olevia videoita tekstikomentojen avulla, ylläpitää visuaalista johdonmukaisuutta kehysten välillä ja luoda jopa 60 sekuntia kestäviä videojaksoja yhdestä kehotuksesta tai kehotteiden sarjasta, jotka muodostavat kerronnan. Yhtiö sanoo voivansa luoda yksityiskohtaisia ​​kohtauksia ja soveltaa elokuvallisia tehosteita, kuten aikajaksoja, ilmakuvia ja erilaisia ​​visuaalisia tyylejä.

DALL-E 2:n julkaisun jälkeen huhtikuussa 2022 olemme nähneet paraatin uusia kuvasynteesi- ja videosynteesimalleja, joiden tavoitteena on antaa kuka tahansa, joka osaa kirjoittaa kirjallisen kuvauksen, luoda yksityiskohtaisen kuvan tai videon. Vaikka kumpaakaan tekniikkaa ei ole täysin jalostettu, sekä tekoälykuva- että videogeneraattorit ovat jatkuvasti kehittyneet tehokkaammiksi.

Helmikuussa esittelimme OpenAI:n Sora-videogeneraattorin, jonka monet uskoivat tuolloin edustavan alan parasta tekoälyvideosynteesiä. Se teki Tyler Perryyn niin vaikutuksen, että hän laittoi elokuvastudion laajennukset pitoon. Mutta toistaiseksi OpenAI ei ole antanut yleistä pääsyä työkaluun – sen sijaan he ovat rajoittaneet sen käytön tiettyyn testaajaryhmään.

Nyt ensi silmäyksellä Googlen Veo näyttää pystyvän tuottamaan samanlaista videota kuin Sora. Emme ole itse kokeilleet, joten voimme mennä vain yrityksen toimittamien kirsikkapoimittujen esittelyvideoiden mukaan verkkosivuillaan. Tämä tarkoittaa, että jokaisen, joka näkee ne, tulee ottaa Googlen väitteet suolalla, koska sukupolven tulokset eivät välttämättä ole tyypillisiä.

Veon näytevideoita ovat hevosella ratsastava cowboy, nopea ampuminen esikaupunkikadulle, kebab grillattu, auringonkukan avautumisen aikaviive ja paljon muuta. Näyttävästi puuttuvat yksityiskohtaiset ihmiskuvaukset, joita tekoälyn kuva- ja videomallien on historiallisesti ollut vaikea luoda ilman ilmeisiä vääristymiä.

Google sanoo, että Veo perustuu yhtiön aiempaan videosukupolven malleihin, mukaan lukien Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phanaki, WALT, VideoPoet ja Lumiere. Laadun ja tehokkuuden lisäämiseksi Veon harjoitustiedot sisältävät yksityiskohtaisempia videotekstejä ja käyttävät pakattuja “piileviä” videoesityksiä. Parantaakseen Veon videoiden luomisen laatua Google lisäsi yksityiskohtaisempia kuvatekstejä Veon harjoittamiseen käytettyihin videoihin, mikä antoi tekoälylle mahdollisuuden tulkita kehotteita tarkemmin.

Veo vaikuttaa myös merkittävältä elokuvien luomiskomentojen tukemisesta: “Kun Veo antaa sekä videon syöttö- että editointikomennon, kuten kajakkien lisäämisen rannikon ilmakuvaan, Veo voi soveltaa tätä komentoa alkuperäiseen videoon ja luoda uuden, muokatun videon, “yhtiö kertoo.

Vaikka demot näyttävät ensi silmäyksellä vaikuttavilta (etenkin verrattuna Will Smithiin, joka syö spagettia), Google myöntää, että tekoälyvideon luominen on vaikeaa. “Visuaalisen yhtenäisyyden ylläpitäminen voi olla haaste videoiden sukupolven malleille”, yhtiö kirjoittaa. “Hahmot, esineet tai jopa kokonaiset kohtaukset voivat välkkyä, hypätä tai muuttua odottamattomasti ruutujen välillä häiritseen katselukokemusta.”

Google on yrittänyt lieventää näitä haittoja “huippuluokan latenteilla diffuusiomuuntajilla”, jotka ovat periaatteessa merkityksetöntä markkinointipuhetta ilman yksityiskohtia. Mutta yritys on tarpeeksi luottavainen malliin työskentelee näyttelijä Donald Gloverin kanssa ja hänen studionsa Gilga luodakseen tekoälyllä luoman demoelokuvan, joka saa ensi-iltansa pian.

Aluksi Veo on saatavilla valituille luojille VideoFX, uusi kokeellinen työkalu, joka on saatavilla Googlen AI Test Kitchen -sivustolla, labs.google. Sisällöntuottajat voivat liittyä VideoFX:n jonotuslistalle saadakseen pääsyn Veon ominaisuuksiin tulevina viikkoina. Google aikoo integroida osan Veon ominaisuuksista YouTube Shortsiin ja muihin tuotteisiin tulevaisuudessa.

Ei vielä sanaa siitä, mistä Google sai Veon harjoitustiedot (jos meidän piti arvata, YouTube oli todennäköisesti mukana). Mutta Google sanoo ottavansa “vastuullisen” lähestymistavan Veon kanssa. Yrityksen mukaan “Veon luomat videot on vesileimattu käyttämällä SynthIDhuippuluokan työkalumme vesileimaukseen ja tekoälyn luoman sisällön tunnistamiseen, ja se on läpäissyt suojaussuodattimia ja muistintarkistusprosesseja, jotka auttavat vähentämään tietosuoja-, tekijänoikeus- ja ennakkoluuloja.”

Leave a Reply

Your email address will not be published. Required fields are marked *