ChatGPT-4o – Hex-kódolás CVE exploitok írásához
A 0Din kutatója, Marco Figueroa azonosított egy olyan kódolási technikát, amely lehetővé teszi a ChatGPT-4o és más népszerű AI modellek esetében a beépített védelmi mechanizmusok megkerülését, lehetővé téve exploit kód generálását. Ez a felfedezés jelentős sérülékenységet tár fel az AI biztonsági intézkedéseiben, és fontos kérdéseket vet fel az AI biztonságának jövőjével kapcsolatban.
A rosszindulatú utasításokat hexadecimális formátumban kódolják, amelyet a ChatGPT-4o a káros szándék felismerése nélkül dekódol, így megkerülve a biztonsági korlátokat. A modell minden egyes utasítást elszigetelten dolgoz fel, lehetővé téve a támadók számára, hogy veszélyes utasításokat rejtsenek látszólag jóindulatú feladatok mögé. A ChatGPT-4o követi az utasításokat, de nem képes kritikusan értékelni a végeredményt, ha a lépések több fázisra vannak felosztva.
A 0Din kutatójának blogbejegyzése rávilágít a mesterséges intelligencia biztonsági funkciók továbbfejlesztésének szükségességére, beleértve a kódolt tartalom korai dekódolását, a jobb kontextustudatosságot és a robusztusabb szűrőmechanizmusokat, amelyekkel felismerhetők az exploitok generálására vagy a sérülékenység kutatására utaló minták. Az eset aláhúzza, hogy a fejlett nyelvi modelleket hogyan lehet kihasználni, és ajánlásokat tesz a jövőbeli biztonsági protokollok megerősítésére az ilyen kockázatok mérséklése érdekében.