ChatGPT-4o – Hex-kódolás CVE exploitok írásához

October 29, 2024 TrainedR AI, ChatGPT, ChatGPT-4o, CVE, Exploit, Hex

A 0Din kutatója, Marco Figueroa azonosított egy olyan kódolási technikát, amely lehetővé teszi a ChatGPT-4o és más népszerű AI modellek esetében a beépített védelmi mechanizmusok megkerülését, lehetővé téve exploit kód generálását. Ez a felfedezés jelentős sérülékenységet tár fel az AI biztonsági intézkedéseiben, és fontos kérdéseket vet fel az AI biztonságának jövőjével kapcsolatban.

A rosszindulatú utasításokat hexadecimális formátumban kódolják, amelyet a ChatGPT-4o a káros szándék felismerése nélkül dekódol, így megkerülve a biztonsági korlátokat. A modell minden egyes utasítást elszigetelten dolgoz fel, lehetővé téve a támadók számára, hogy veszélyes utasításokat rejtsenek látszólag jóindulatú feladatok mögé. A ChatGPT-4o követi az utasításokat, de nem képes kritikusan értékelni a végeredményt, ha a lépések több fázisra vannak felosztva.

A 0Din kutatójának blogbejegyzése rávilágít a mesterséges intelligencia biztonsági funkciók továbbfejlesztésének szükségességére, beleértve a kódolt tartalom korai dekódolását, a jobb kontextustudatosságot és a robusztusabb szűrőmechanizmusokat, amelyekkel felismerhetők az exploitok generálására vagy a sérülékenység kutatására utaló minták. Az eset aláhúzza, hogy a fejlett nyelvi modelleket hogyan lehet kihasználni, és ajánlásokat tesz a jövőbeli biztonsági protokollok megerősítésére az ilyen kockázatok mérséklése érdekében.

Forrás

You May Also Like

AI rendszerek kockázatelemzése és javaslatok a biztonságos használatra

CPR: Cyber Security Report 2026

AI-támogatott phishing