Az OpenAI úgy alkotta meg érvelő AI-modelljeit, hogy azok ne segíthessenek a bűnözőknek

Varga Kristóf

| 2024 december 24. 12:31

A technológia rohamtempóban zajló fejlődése következtében a biztonsági intézkedések szerepe is egyre jelentősebbé válik.

Hirdetés

A ChatGPT mögött álló OpenAI múlt pénteken mutatta be legújabb nagy nyelvi modelljét, az o3-at, amely a vállalat elmondása alapján sokkal fejlettebb, mint az o1 vagy a korábbi modellek. A cég szerint az előrelépés egy új biztonsági paradigma alkalmazásának is köszönhető, amelyet kifejezetten az o-sorozatú modellek képzéséhez dolgoztak ki.

Az ezek mögött álló technológia lényegében biztosítja, hogy a vállalat érvelő AI-modelljei összhangban maradjanak a fejlesztők által meghatározott értékekkel és irányelvekkel. Az OpenAI a módszert annak elérésére használta, hogy az o1 és o3 modellek a felhasználói parancsok feldolgozása során is "gondolkodjanak" a biztonsági kérdésekről, ezzel minimalizálva a nem kívánatos válaszokat.

Hirdetés

A vállalat kutatásai szerint a módszer jelentősen javította az o1 és o3 általános igazodását a vállalat biztonsági elveihez. Ez a gyakorlatban azt eredményezte, hogy a modellek ritkábban válaszoltak olyan kérdésekre, amelyeket az OpenAI nem ítélt biztonságosnak, miközben hatékonyabbá váltak a "jóindulatú" kérdések kezelésében.

Az o-sorozatú modellek a kérdések feldolgozása során belsőleg "mérlegelik", hogyan adhatnak biztonságos választ. Ez a folyamat nagyon hasonló ahhoz, ahogy más modellek kisebb lépésekre bontják a komplex parancsokat, mielőtt válaszolnának.

A mesterséges intelligencia biztonsága számos szempontot foglal magában, azonban az OpenAI jelen esetben főként arra összpontosított, hogy megakadályozza a modellek válaszadási készségeinek kihasználását nem biztonságos célokra. Ide tartozhat például, ha valaki bombakészítési útmutatást, kábítószer-beszerzési tanácsot vagy bűncselekmények elkövetésére vonatkozó segítséget kér az adott chatbottól. Az OpenAI célja, hogy ilyen kérések esetén a modellek megtagadják a választ.

Szép, gyors és mindenre képes – tényleg bármit megtehetsz a Pura 70-nel (x)A modern kor svájci bicskája az okostelefon, méghozzá az appoknak hála, amiből bármilyen vígan elfut a Huawei Pura 70-en. Mutatjuk, miként omlanak le a Google-mentesség falai.

Hirdetés

Az OpenAI úgy alkotta meg érvelő AI-modelljeit, hogy azok ne segíthessenek a bűnözőknek

Hirdetés

Verhetetlen áron zsákolhatod be a Windows 11 Prót

Kövess Facebookon!

Kijev az egyik űrhajós letartóztatását kéri az űrállomás fedélzetén

Komoly hiba miatt állította le a Samsung a One UI frissítését

A Microsoft most már tényleg nem vár tovább: elkezdték kigurítani a Recall tesztverzióját

A böngésző, ami nem fecseg rólad - a legjobb Brave tippek

Megjött a OnePlus Watch 3, de az ára valószínűleg nem fog tetszeni

A ChatGPT már minden beszélgetésetekre emlékszik, és fel is fogja használni őket