A közösségi médiabirodalmáról ismert Meta izgalmasabb bejelentései közé tartozik a néhány napja leleplezett Make-A-Video nevű videógeneráló algoritmus, amely a hagyományos képgenerátorokhoz hasonlóan már néhány szóból képes mozgó "felvételeket" alkotni. A jelek szerint azonban nem csak Mark Zuckerbergék fantáziáját mozgatja ez a téma, most ugyanis a Google is beharangozta a saját technológiáját.
Az Imagen Video néven futó megoldás az 5 hónapja bemutatott Imagen képgenerátor mozgóképes párja, és 1280x768 pixeles (HD) felbontású, 24 fps képkockasebességgel futó videókat alkot, igény szerint akár ismert művészek stílusában. A Google által megosztott tanulmány alapján az algoritmus forgó 3D-s objektumokat is létre tud hozni, illetve a szövegek animálásától sem riad vissza.
A technológia mindezt egy lépcsőzetes megközelítéssel hozza össze, melynek első állomásaként egy csupán 24x48 pixeles, 3 fps képkockasebességű videót készít a bevitt szövegből, majd 6 további lépésben egyre feljebb skálázza a részletességet. A végeredményként kapott filmekhez viszont nem kell nagy popcorn, mivel csak 5,3 másodperces hosszúságúak.
Az Imagen Videónak szentelt weboldalon több mintavideóra is rácsodálkozhatunk, köztük egyebek mellett egy mosogató plüssmackóval, egy sétáló elefánttal és egy hófödte dzsungellel (!). A saját elképzeléseink megvalósítása viszont még odébb lehet, mivel a Google egyelőre nem szándékozik a nagyközönség rendelkezésére bocsátani a technológiát.
A keresőóriás nem is csinál titkot abból, hogy miért döntött így. Az Imagen Videót a LAION-400M adatállománnyal tanították be, 14 millió videó- és képpár, valamint 60 millió kép- és szövegpár segítségével. A LAION pedig az internetről gyűjti össze az anyagokat, ezért problémásnak számít, amit a Google szűréssel igyekezett kiküszöbölni, de még így is maradhattak benne szexuális jellegű, erőszakos vagy sztereotip tartalmak.
A cég emellett azt is szeretné elkerülni, hogy egyesek félrevezető vagy erőszakos anyagok készítésére használják az algoritmust, így megtartják maguknak, amíg nem sikerül megnyugtató választ találniuk az aggályokra.