Google-ov Lumiere: AI video tehnologija koja briše granice između stvarnog i nestvarnog

Google je predstavio svoj novi model generisanja AI videa, Lumiere, koji koristi inovativni difuzioni model nazvan Space-Time-U-Net (STUNet). Ovaj model omogućava Lumiere-u da precizno odredi gde se objekti nalaze u videu (prostor) i kako se istovremeno kreću i menjaju (vreme). Prema izveštaju Ars Technica, ova metoda omogućava Lumiere-u da kreira video u jednom procesu, umesto da spaja manje statične kadrove.

Vreme Čitanja: < 1 min

google-lumiere-980-fi

Ilustracija: DALL-E3

Revolucionarna AI video tehnologija

Lumiere počinje kreiranje videa sa osnovnog kadra dobijenog iz zadatog upita. Zatim koristi STUNet okvir za procenu kretanja objekata unutar tog kadra, stvarajući dodatne kadrove koji se međusobno prelivaju, stvarajući izgled besprekornog kretanja. Lumiere takođe generiše 80 kadrova u poređenju sa 25 kadrova koje nudi Stable Video Diffusion.

Realističnost i konkurencija

AI video generacija i alati za uređivanje su u poslednjih nekoliko godina prešli put od neprirodnog do gotovo realističnog prikaza. Google-ova tehnologija se uspostavlja u prostoru koji već zauzimaju konkurenti poput Runway-a, Stable Video Diffusion-a ili Meta-ovog Emu-a. Runway, jedna od prvih masovnih tekst-u-video platformi, objavila je Runway Gen-2 u martu prošle godine i počela da nudi realističnije izgledajuće videe.

Potencijal i primena

Osim generisanja tekst-u-video sadržaja, Lumiere će takođe omogućiti generisanje slika-u-video, stilizovanu generaciju koja korisnicima omogućava da prave videe u određenom stilu, cinemagrafe koji animiraju samo deo videa, i inpainting za maskiranje dela videa radi promene boje ili uzorka. Google-ov rad na Lumiere-u naglašava potencijalnu zloupotrebu tehnologije za stvaranje lažnog ili štetnog sadržaja, ističući važnost razvoja i primene alata za otkrivanje pristrasnosti i zlonamernih slučajeva upotrebe.

Značajan napredak u AI video tehnologiji

Google-ov Lumiere predstavlja značajan napredak u AI video tehnologiji, pružajući platformu koja je uporediva, a možda i bolja od opšte dostupnih AI video generatora poput Runway-a i Pika. Ova tehnologija ne samo da pokazuje Google-ovu sposobnost razvoja naprednih AI alata, već i otvara nove mogućnosti za kreativnost i inovacije u digitalnom svetu.

Prijavi se na novosti.