Novac

Нови оквир агента одговара системима вештачке интелигенције које је дизајнирао човек — и додаје нулту цену закључивања за примену

Агенти изграђени на врху данашњих модела често прекидају једноставне измене — нову библиотеку, модификацију тока посла — и захтевају људски инжењер да то поправи. То је један од најупорнијих изазова у примени вештачке интелигенције за предузећа: стварање агената који се могу прилагодити динамичким окружењима без сталног држања за руку. Иако су данашњи модели моћни, они су углавном статични.

Да би се позабавили овим проблемом, развили су се истраживачи са Калифорнијског универзитета у Санта Барбари Агенти који се развијају у групи (ГЕА), нови оквир који омогућава групама АИ агената да се развијају заједно, деле искуства и поново користе своје иновације како би се временом самостално побољшали.

У експериментима на сложеним задацима кодирања и софтверског инжењеринга, ГЕА је знатно надмашио постојеће оквире за самопобољшавање. Можда је најважније за доносиоце одлука у предузећу, систем је аутономно еволуирао агенте који су одговарали или превазилазили перформансе оквира које су мукотрпно дизајнирали људски стручњаци.

Ограничења еволуције ‘вука самотњака’

Већина постојећих агентски АИ системи ослањају се на фиксне архитектуре које су дизајнирали инжењери. Ови системи се често боре да превазиђу границе могућности које намећу њихов почетни дизајн.

Да би ово решили, истраживачи су дуго покушавали да створе само-еволуирајуће агенте који могу аутономно да модификују сопствени код и структуру како би превазишли своје почетне границе. Ова способност је од суштинског значаја за руковање отвореним окружењима у којима агент мора континуирано да истражује нова решења.

Међутим, садашњи приступи самоеволуцији имају велику структурну ману. Као што истраживачи примећују у свом раду, већина система је инспирисана биолошком еволуцијом и дизајнирана је около "индивидуално-центричан" процеси. Ове методе обично користе приступ структурираним стаблом: један "родитељ" агенс је одабран да производи потомство, стварајући различите еволуционе гране које остају стриктно изоловане једна од друге.

Ова изолација ствара ефекат силоса. Агент у једној грани не може да приступи подацима, алатима или токовима посла које је открио агент у паралелној грани. Ако одређена лоза не буде изабрана за следећу генерацију, свако вредно откриће које је направио тај агент, као што је нови алат за отклањање грешака или ефикаснији ток рада тестирања, нестаје са њим.

У свом раду истраживачи доводе у питање неопходност придржавања ове биолошке метафоре. "АИ агенти нису биолошке особе," они се свађају. "Зашто би њихова еволуција остала ограничена биолошким парадигмама?"

Колективна интелигенција агената који се развијају у групи

ГЕА мења парадигму тако што третира групу агената, а не појединца, као основну јединицу еволуције.

Процес почиње одабиром групе надређених агената из постојеће архиве. Да би обезбедио здраву мешавину стабилности и иновација, ГЕА бира ове агенте на основу комбинованог резултата учинка (компетентност у решавању задатака) и новости (колико се њихове способности разликују од других).

За разлику од традиционалних система у којима агент учи само од свог директног родитеља, ГЕА ствара заједнички скуп колективног искуства. Овај скуп садржи еволуционе трагове свих чланова родитељске групе, укључујући модификације кода, успешна решења задатака и историје позивања алата. Сваки агент у групи добија приступ овој колективној историји, омогућавајући им да уче из открића и грешака својих вршњака.

„Модул за рефлексију“, који покреће велики језички модел, анализира ову колективну историју да би идентификовао обрасце широм групе. На пример, ако један агент открије алат за отклањање грешака високих перформанси, док други усавршава ток рада тестирања, систем извлачи оба увида. На основу ове анализе, систем генерише висок ниво "еволуционе директиве" који усмеравају стварање дечје групе. Ово осигурава да следећа генерација поседује комбиноване снаге свих својих родитеља, а не само особине једне лозе.

Међутим, овај приступ ума кошнице најбоље функционише када је успех објективан, као што је код задатака. "За мање детерминистичке домене (нпр. креативно генерисање), сигнали евалуације су слабији," Зхаотиан Венг и Ксин Ериц Ванг, коаутори рада, рекли су за ВентуреБеат у писаним коментарима. "Слепо дељење резултата и искустава може довести до искуства ниског квалитета која делују као бука. Ово указује на потребу за јачим механизмима филтрирања искуства" за субјективне задатке.

ГЕА у акцији

Истраживачи су тестирали ГЕА у односу на тренутну најсавременију саморазвијајућу основу, тј Дарвин Годел машина (ДГМ), на два ригорозна мерила. Резултати су показали огроман скок у способности без повећања броја коришћених агенаса.

Овај приступ сарадње такође чини систем отпорнијим на кварове. У својим експериментима, истраживачи су намерно разбили агенте тако што су ручно убацивали грешке у њихове имплементације. ГЕА је успела да поправи ове критичне грешке у просеку од 1,4 итерације, док је основној линији требало 5 итерација. Систем ефикасно користи "здраво" чланови групе да дијагностикују и закрпе компромитоване.

На СВЕ-бенцх Верифиед, бенцхмарк-у који се састоји од стварних ГитХуб проблема, укључујући грешке и захтеве за функцијама, ГЕА је постигла стопу успешности од 71,0% у поређењу са базних 56,7%. Ово значи значајно повећање аутономне инжењерске пропусности, што значи да су агенти далеко способнији да се баве одржавањем софтвера у стварном свету. Слично, на Полиглоту, који тестира генерисање кода на различитим програмским језицима, ГЕА је постигла 88,3% наспрам основних 68,3%, што указује на високу прилагодљивост различитим технолошким стековима.

За тимове за истраживање и развој предузећа, најкритичнији налаз је да ГЕА омогућава АИ да се дизајнира једнако ефикасно као и људски инжењери. На СВЕ-бенцх-у, ГЕА-ина стопа успешности од 71,0% ефективно одговара перформансама ОпенХандсврхунски оквир отвореног кода који су дизајнирали људи. На Полиглоту, ГЕА је значајно надмашила Аидера, популарног асистента за кодирање, који је постигао 52,0%. Ово сугерише да би организације на крају могле да смање своје ослањање на велике тимове брзих инжењера за подешавање оквира агената, пошто агенти могу самостално да науче ове оптимизације.

Ова ефикасност се проширује и на управљање трошковима. "ГЕА је експлицитно двостепени систем: (1) еволуција агента, затим (2) закључивање/распоређивање," рекли су истраживачи. "Након еволуције, примењујете једног еволуираног агента… тако да је трошак закључивања предузећа у суштини непромењен у односу на стандардно подешавање једног агента."

Успех ГЕА у великој мери произилази из његове способности да консолидује побољшања. Истраживачи су пратили специфичне иновације које су агенти измислили током еволуционог процеса. У основном приступу, вредни алати су се често појављивали у изолованим гранама, али нису успели да се размножавају јер су се те специфичне лозе завршиле. У ГЕА, модел заједничког искуства је осигурао да ове алате усвоје агенти са најбољим учинком. Најбољи ГЕА агент је интегрисао особине 17 јединствених предака (који представљају 28% популације), док је најбољи основни агент интегрисао особине од само 9. У ствари, ГЕА ствара "супер-запосленик" који поседује комбиновану најбољу праксу целе групе.

"Радни ток у производњи инспирисан ГЕА би омогућио агентима да прво покушају са неколико независних поправки када дође до кварова," истраживачи су објаснили у вези са овом способношћу самоизлечења. "Агент за рефлексију (обично покретан јаким основним моделом) онда може сумирати резултате… и водити свеобухватније ажурирање система."

Штавише, побољшања која је открио ГЕА нису везана за одређени основни модел. Агенти који су еволуирали коришћењем једног модела, као што је Цлауде, задржали су своје побољшане перформансе чак и када је основни мотор замењен другом породицом модела, као што је ГПТ-5.1 или ГПТ-о3-мини. Ова преносивост нуди предузећима флексибилност да мењају добављаче модела без губљења прилагођених архитектонских оптимизација које су њихови агенти научили.

За индустрије са строгим захтевима за усклађеност, идеја о само-модификовању кода може звучати ризично. Да би се позабавили овим, аутори су рекли: "Очекујемо да ће имплементације у предузећима укључити заштитне ограде које се не могу развијати, као што су извршење у заштићеном окружењу, ограничења политике и слојеви верификације."

Док истраживачи планирају да ускоро објаве званични код, програмери већ могу да почну да концептуално имплементирају ГЕА архитектуру на врху постојећих оквира агената. Систем захтева три кључна додатка стандардном стеку агента: „архиву искуства“ за чување еволуционих трагова, „модул рефлексије“ за анализу групних образаца и „модул за ажурирање“ који омогућава агенту да модификује сопствени код на основу тих увида.

Гледајући унапред, оквир би могао да демократизује напредни развој агената. "Један правац који обећава је цевовод хибридне еволуције," истраживачи су рекли, "где мањи модели рано истражују да би акумулирали различита искуства, а јачи модели касније воде еволуцију користећи та искуства."

извор линк

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button