Agentic Detection and Response tanulmány
A MLSys 2026 konferencián bemutatott tanulmány az ADR (Agentic Detection and Response) rendszert ismerteti, amelyet az Uber fejlesztett ki a vállalati környezetben működő AI agents biztonsági felügyeletére. A kutatás abból indul ki, hogy a hagyományos EDR- és naplózási megoldások nem képesek megfelelően követni az olyan agent-ek tevékenységét, amelyek a Model Context Protocol (MCP) segítségével fájlokat módosítanak, rendszerekhez kapcsolódnak vagy automatizált műveleteket hajtanak végre. A biztonsági csapatok gyakran látják a végrehajtott műveletet, de nem látják az azt kiváltó promptokat, az ügynök döntési folyamatát vagy az események közötti ok-okozati kapcsolatot.
Az ADR három fő komponensből áll. Az ADR Sensor részletes telemetriát gyűjt az agent-ek működéséről, beleértve a promptokat, a használt eszközöket és a végrehajtott műveleteket. Az ADR Explorer automatizált red teaming környezetként szolgál, amely támadási forgatókönyveket generál és tesztel az üzembe helyezés előtt. Az ADR Detectorpedig egy kétlépcsős detektálási modellt alkalmaz, egy gyors szűrő azonosítja a gyanús eseményeket, majd egy összetettebb elemző réteg vizsgálja azok kontextusát.
A rendszer több mint tíz hónapon keresztül működött éles környezetben az Uber infrastruktúrájában. A publikáció szerint több mint 7200 hosztot és napi 10 000-nél több agent-folyamatot figyelt meg, miközben több száz hitelesítő adat kiszivárgását észlelte. A kutatók 26 különböző kategóriába sorolták az azonosított incidenseket, és a rendszer 97,2%-os pontosságot ért el a megelőző védelmi funkciók tesztelése során.
A tanulmányhoz létrehozták az ADR-Bench értékelő keretrendszert is, amely 302 feladatot, 17 támadási technikát és 133 MCP-szervert tartalmaz. Az eredmények alapján az ADR a GuardAgent, ALRPHFS és LlamaFirewall megoldásoknál lényegesen jobb észlelési arányt produkált, miközben nem generált téves riasztásokat a tesztkörnyezetben. Az Agent alapú AI-rendszerek terjedésével a védelemnek már nem csupán a végrehajtott műveleteket, hanem az ügynökök döntési láncát, a promptok hatását és az automatizált folyamatok teljes kontextusát is figyelembe kell vennie.