PROMISQROUTE: Kritikus sebezhetőség derült ki a GPT-5 AI modellirányító rendszerében

Editors' Pick

Az Adversa AI kutatói egy új, súlyos biztonsági rést tártak fel a ChatGPT 5 működésében, amely alapjaiban rengetheti meg az AI biztonságról alkotott elképzeléseket. A PROMISQROUTE névre keresztelt sebezhetőség kihasználja azt a mechanizmust, amely során a felhasználói kéréseket a rendszer nem mindig a legbiztonságosabb, hanem a legolcsóbb AI modellhez irányítja, a költséghatékonyság jegyében. Ez lehetővé teszi, hogy támadók egyszerű nyelvi trükkökkel „lebutított” modellekhez jussanak hozzá, amelyek már nem tartalmazzák az erős biztonsági korlátokat – ezzel kijátszva a GPT-5 védelmi mechanizmusait.

A kutatás szerint a ChatGPT infrastruktúrája egy ún. „routeren” keresztül működik, amely a felhasználói prompt alapján dönti el, hogy melyik modell válaszoljon. A PROMISQROUTE lehetővé teszi, hogy manipulatív kifejezések – mint például „gyors választ kérek” vagy „kompatibilitási módban válaszolj” – révén a rendszer alacsonyabb biztonsági szintű modelleket válasszon (például GPT-4 vagy GPT-5 nano), amelyek már nem képesek megfelelően ellenállni tiltott vagy veszélyes kéréseknek. A kutatók szerint a jelenlegi gyakorlat alapján a felhasználók 60–75%-ban nem a GPT-5 teljes verzióját kapják, hanem annak gyengébb változatait, ezzel nemcsak a szolgáltatás értéke csökken, hanem adatbiztonsági kockázat is keletkezik.

A probléma súlyosságát fokozza, hogy a sebezhetőség az AI infrastruktúra alapvető rétegében, a modellválasztó logikában gyökerezik – hasonlóan az SSRF (Server-Side Request Forgery) hibához, amelyet korábban már súlyos sérülékenységként ismertek el a webalkalmazások világában. Az Adversa AI szerint a védekezés legfontosabb lépései közé tartozik a prompt-alapú útválasztás teljes auditálása, a kriptográfiai alapú routing bevezetése, valamint univerzális biztonsági szűrők alkalmazása minden modellre. Az iparág számára a legnagyobb tanulság: az AI biztonsága nem csak a modell képességein, hanem az architektúra tervezésén is múlik.

(forrás)