Az olyan mesterséges intelligencián alapuló képgeneráló technológiák, mint a DALL-E 2 és a Midjourney már széles körben is meglehetősen ismertnek számítanak, és rendszeresen szállítják a különböző lenyűgöző, vagy éppen kevésbé lenyűgöző alkotásokat.
A Facebookot, az Instagramot és a WhatsAppot is birtokló Meta azonban már a digitális teremtés következő szintjén jár, és egy olyan megoldással állt elő, amely mozgóképes anyagokat hoz létre az előre megadott szövegekből.
Az egyszerűen csak Make-A-Video néven futó újdonságot maga az alapító-cégvezető, Mark Zuckerberg leplezte le a Facebookon, néhány példa demonstrálásával. A CEO posztjában három rövid videót láthatunk egy festegető Teddy-mackóval, egy landoló repülő csészealjjal és egy sapkás bébi lajhárral, aki egy laptop működését próbálja kisilabizálni.
Mindegyik anyagot a Make-A-Video generálta, a címül megadott szöveg alapján.
Az egyelőre csak promóciós céllal bemutatott, vagyis a közönség számára nem használható platform weboldalán további videókra is rácsodálkozhatunk, például egy úszkáló bohóchallal, egy esőben sétáló párral és egy megelevenedett olajfestményel. Az algoritmus pedig akár arra is képes, hogy egy feltöltött képet alakítson videóvá, amit ugyancsak látványosan demonstrál a webes felület.
Zuckerberg leírása alapján a Meka-A-Video létrehozásához a Meta egy felügyeletlen gépi tanulási réteget adott a hagyományos képgeneráló algoritmushoz, amely meghatározza a pixelek mozgás következtében bekövetkező változását. A végeredmény kétségtelenül elképesztő, arról viszont nem szól a fáma, hogy mikor játszhadozhatunk mi is el vele, mint a nemrég mindenki számára elérhetővé tett DALL-E 2-vel. Az érdeklődők ugyanakkor a feljebb linkelt weboldalon már most feliratkozhatnak egy későbbi próbakörre.