

У последњих годину дана, АИ агенти су постали популарни. ОпенАИ, Гоогле и Антхропиц су покренули јавне агенте дизајниране да преузму задатке у више корака које су им предали људи. У последњих месец дана, АИ агент отвореног кода под називом ОпенЦлав заузео је веб захваљујући својим импресивним аутономним могућностима (и великим безбедносним проблемима). Али ми заправо немамо осећај за размере операција агената вештачке интелигенције и да ли се сав разговор поклапа са стварном применом. Лабораторија за рачунарске науке и вештачку интелигенцију МИТ-а (ЦСАИЛ) је намеравала да то поправи са својим недавно објављеним индексом АИ агената из 2025. године, који пружа наш први прави поглед на размере и операције АИ агената у дивљини.
Истраживачи су открили да је интересовање за АИ агенте несумњиво нагло порасло у последњих годину дана. Истраживачки радови у којима се помиње „АИ агент“ или „Агентиц АИ“ у 2025. години више него удвостручили укупан укупан број од 2020. до 2024. заједно, а МцКинсеи истраживање је показало да је 62% компанија пријавило да њихове организације у најмању руку експериментишу са АИ агентима.
Са свим тим интересовањем, истраживачи су се фокусирали на 30 истакнутих АИ агената у три одвојене категорије: опције засноване на ћаскању као што су ЦхатГПТ Агент и Цлауде Цоде; ботови засновани на претраживачу као што су Перплекити Цомет и ЦхатГПТ Атлас; и опције за предузећа као што су Мицрософт 365 Цопилот и СервицеНов Агент. Иако истраживачи нису дали тачне бројке о томе колико је АИ агената распоређено широм веба, они су понудили знатан увид у то како они раде, што је углавном без сигурносне мреже.
Само половина од 30 АИ агената које је МИТ ЦСАИЛ ставио под лупу укључују објављене безбедносне оквире или оквире поверења, попут Антхропиц-ова политика одговорног скалирања, ОпенАИ-јев оквир за спремностили Мицрософтов одговорни АИ стандард. Сваки трећи агент нема никакву документацију о безбедносном оквиру, а пет од 30 нема стандарде усклађености. То је забрињавајуће када узмете у обзир да 13 од 30 прегледаних система показује граничне нивое деловања, што значи да могу да раде углавном без људског надзора у проширеним секвенцама задатака. Агенти претраживача посебно имају тенденцију да раде са знатно већом аутономијом. Ово би укључивало ствари као што је Гоогле-ов недавно покренут АИ „Аутобровсе“, који може да доврши задатке у више корака навигацијом кроз различите веб локације и коришћењем корисничких информација за обављање ствари као што је пријављивање на сајтове у ваше име.
Један од проблема са пуштањем агената да слободно прегледавају и са мало заштитних ограда је то што се њихова активност готово не разликује од људског понашања и они мало чине да разбију било какву забуну која би могла да се појави. Истраживачи су открили да 21 од 30 агената не открива крајњим корисницима или трећим странама да су они агенти вештачке интелигенције, а не људи. Ово доводи до тога да се већина активности АИ агената погрешно тумачи за саобраћај људи. МИТ је открио да је само седам агената објавило стабилне низове Усер-Агент (УА) и опсеге ИП адреса ради верификације. Скоро исто толико експлицитно користи УА стрингове сличне Цхроме-у и стамбене/локалне ИП контексте да би њихови захтеви за саобраћај изгледали људскији, чинећи веб-сајту скоро немогућим да направи разлику између аутентичног саобраћаја и понашања робота.
За неке АИ агенте, то је заправо тржишна карактеристика. Истраживачи су открили да се БровсерУсе, АИ агент отвореног кода, продаје корисницима тврдећи да заобилази анти-бот системе да би претраживао „као човек“. Више од половине свих тестираних ботова не пружа никакву конкретну документацију о томе како рукују датотекама роботс.ткт (текстуалне датотеке које су смештене у основни директоријум веб локације да би упутиле веб пописиваче о томе како могу да ступе у интеракцију са сајтом), ЦАПТЦХА које су намењене за аутентификацију људског саобраћаја или АПИ-је сајта. Збуњеност је чак довела до тога да агенти делују у име корисника не би требало да подлеже ограничењима стругања пошто функционишу „баш као људски помоћници“.
Чињеница да су ови агенти у дивљини без много заштите значи да постоји стварна опасност од експлоатације. Недостаје стандардизација за безбедносне процене и обелодањивања, остављајући многе агенте потенцијално рањивим на нападе као што су брзе ињекције, у којима АИ агент ухвати скривени злонамерни упит који га може натерати да прекрши своје безбедносне протоколе. Према МИТ-у, девет од 30 агената нема документацију о заштитним оградама од потенцијално штетних радњи. Скоро сви агенти не откривају резултате интерног тестирања безбедности, а 23 од 30 не нуде информације о безбедности трећих страна о тестирању.
Само четири агента — ЦхатГПТ Агент, ОпенАИ Цодек, Цлауде Цоде и Гемини 2.5 — су обезбедила системске картице специфичне за агенте, што значи да су безбедносне процене биле прилагођене томе како агент заправо функционише, а не само основном моделу. Али граничне лабораторије као што су ОпенАИ и Гоогле нуде више документације о „егзистенцијалним ризицима и ризицима усклађивања понашања“, недостају им детаљи о врсти безбедносних рањивости које могу настати током свакодневних активности – навика коју истраживачи називају „безбедносно прање“, коју описују као објављивање безбедности на високом нивоу и само селективне етичке доказе у складу са дисковним оквиром. ригорозно проценити ризик.
Барем је постојао одређени замах у решавању забринутости које су изнели истраживачи МИТ-а. Још у децембру, ОпенАИ и Антхропиц (између осталих) удружили су снаге, најављујући фондацију за креирање развојног стандарда за АИ агенте. Али Индекс АИ Агента показује колико је широк јаз у транспарентности када је у питању агентско АИ деловање. Агенти вештачке интелигенције преплављују веб и радно место, функционишући са шокантном количином аутономије и минималним надзором. Мало што указује на то да ће безбедност ускоро достићи ниво.


