Az OpenAI-ba és a ChatGPT-be 10 milliárd dollárt fektető Microsoft addig akarja ütni a nagy nyelvi modelleken (Large Language Model, LLM) alapuló chatbotok témáját, amíg az még forró, ennek jegyében pedig már korábban beharangozták, hogy március 16-án egy műsorral jelentkeznek, amely a mesterséges intelligencia produktivitási célú felhasználására koncentrál majd.
Most pedig kiderülhetett, hogy mi lesz az esemény nagy attrakciója, miután a vállalat egyik németországi illetékese csak úgy mellékesen elejtette az információt egy rendezvényen.
Elsőként a helyszínről tudósító Heise.de számolt be róla, hogy a Microsoft Germany technikai igazgatója, Dr. Andreas Braun az "AI in Focus - Digital Kickoff" című eseményen elárulta, a jövő héten leleplezik az OpenAI következő generációs nagy nyelvi modelljét, a GPT-4-et, amely már multimodális lesz, és "teljesen más lehetőségeket" tartogat, köztük a videókkal.
Mint ismert, a több mint 100 millió felhasználót meghódító ChatGPT chatbot a GPT 3.5 nyelvi modellre épül, és jelenleg csupán szövegalapú bevitellel képes dolgozni, tehát csak a szöveges parancsokat érti, és szöveges válaszokat ad rájuk. Braun szavai alapján a GPT-4 már a videókkal is kezdeni fog valamit.
A modalitást érintő megjegyzésből arra következtethetünk, hogy a vezető itt nem videók generálására gondolt, hanem arra, hogy a nyelvi modell már a videós inputokat is értelmezni fogja. A Microsoft ugyanis néhány napja leplezte le az OpenAI-tól függetlenül fejlesztett Kosmos-1 algoritmust, amely szintén multimodális alapon nyugszik, és fényképes, videós vagy hangalapú információkat is fel tud dolgozni.
Dr. Braun ugyan nem mondta ki konkrétan, hogy a leleplezést a bevezetőben említett március 16-i eseményre időzítik, de a műsor jövő hét csütörtökre esik, ezért valószínűleg ennek keretében prezentálják majd a GPT-4 nyelvi modellt.