A ChatGPT, a DALL-E és a Sora mögött álló OpenAI megtartotta a nagy tavaszi termékbemutatóját, amitől előzetesen sokan várták, hogy az eseményen leleplezik a mesterséges intelligenciás szolgáltatásokat hajtó nagy nyelvi modell következő, 5-ös generációját és egy saját keresési platformot, amivel egyenesen a Google torkának ugrik a cég.
Ezek közül végül egyikre sem került sor, de a 2016-ban alapított vállalat így sem érkezett üres kézzel, egy minden korábbinál lenyűgözőbb technológiát villantva a publikumnak.
Az OpenAI ugyanis bemutatta a legújabb nyelvi modelljét, amely GPT-4o néven fut. Az "o" az omni rövidítése, és arra utal, hogy a technológia egyszerre, valós időben kezeli a szöveget, a hangot és a képet is. A GPT-4o ráadásul kétszer gyorsabb az eddigi csúcsot jelentő GPT-4 Turbónál, aminek pedig a legtöbben örülhetnek, hogy a régi modellel ellentétben már a ChatGPT ingyenes verziójában is elérhető lesz.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
A multimodális megközelítésnek hála a GPT-4o egy videós beszélgetésen belül gond nélkül reagál a képen látottakra, és úgy érintkezhetünk vele, mintha csak egy emberrel beszélgetnénk. A mesterséges intelligencia még a saját hangnemét is módosítani tudja, így ha például arra kérjük, hogy legyen drámaibb, vagy beszéljen robotosabb hangon, akkor megteszi nekünk. Az OpenAI demójának egyik látványos része volt, hogy a GPT-4o a videós kapcsolaton keresztül, "ránézésből" meg tudta állapítani egy ember hangulatát, de matematikai egyenleteket is megold, vagy véleményezi a látott számítógépes kódokat.
A frissen bemutatott funkciók a következő hetek során válnak elérhetővé, a cég pedig két új asztali alkalmazást is bejelentett a macOS-re és Windowsra. Első körben az előbbi jelent meg, egyelőre csak ChatGPT Plus előfizetők számára, de az előttünk álló hetekben az ingyenes felhasználókra is kiterjesztik a hozzáférést, illetve a Windows-alapú kliens is valamikor a későbbiek során fog debütálni.
Az új GPT-4o nyelvi modell képességeiről az OpenAI hivatalos blogposztjában olvashatsz részletesen.