

Квен тим истраживача АИ кинеског гиганта е-трговине Алибаба појавио се у последњих годину дана као један од глобалних лидера у развоју вештачке интелигенције отвореног кода, објављујући мноштво моћних великих језичких модела и специјализованих мултимодалних модела који се приближавају, ау неким случајевима и надмашују перформансе власничких америчких лидера као што су ОпенАИ, кАИ, Антхропиц.
Сада се Квен тим поново вратио ове недеље са убедљивим издањем које одговара овом "кодирање вибрације" лудница која је настала последњих месеци: Квен3-Цодер-Нектспецијализовани модел са 80 милијарди параметара дизајниран да испоручи елитне агентске перформансе у оквиру лаганог активног отиска.
Објављен је уз дозволу Апацхе 2.0, омогућавајући комерцијалну употребу како великим предузећима тако и независним програмерима, уз тегови модела доступни на Хуггинг Фаце у четири варијанте и а технички извештај описујући неке од својих приступа обуци и иновација.
Издање означава велику ескалацију у глобалној трци у наоружању за ултимативног асистента за кодирање, након недеље у којој је свемир експлодирао новим учесницима. Од огромног повећања ефикасности упрегања Антхропиц Цлауде Цоде-а до високопрофилног лансирања апликације ОпенАИ Цодек и брзог усвајања оквира отвореног кода у заједници као што је ОпенЦлав, конкурентски пејзаж никада није био препун.
У овом окружењу са високим улозима, Алибаба не само да држи корак – већ покушава да постави нови стандард за отворену интелигенцију.
За доносиоце одлука ЛЛМ, Квен3-Цодер-Нект представља фундаментални помак у економији АИ инжењеринга. Док модел садржи 80 милијарди укупних параметара, он користи ултра ретку архитектуру Миктуре-оф-Екпертс (МоЕ) која активира само 3 милијарде параметара по пролазу унапред.
Овај дизајн му омогућава да испоручи могућности расуђивања које се такмиче са масивним власничким системима уз одржавање ниских трошкова имплементације и велике пропусности лаког локалног модела.
Решавање уског грла дугог контекста
Основни технички пробој иза Квен3-Цодер-Нект-а је хибридна архитектура дизајнирана посебно да заобиђе проблеме квадратног скалирања који муче традиционалне Трансформере.
Како се прозори контекста шире – а овај модел подржава масивних 262.144 токена – традиционални механизми пажње постају рачунски превисоки.
Стандардни трансформатори пате од а "зид меморије" где цена обраде контекста расте квадратно са дужином секвенце. Квен ово решава комбиновањем Гатед ДелтаНет-а са Гатед Аттентион-ом.
Гатед ДелтаНет делује као алтернатива линеарне сложености стандардној софтмак пажњи. Омогућава моделу да одржи стање у свом прозору од четврт милиона токена без експоненцијалних казни кашњења типичних за размишљање дугог хоризонта.
Када је упарен са ултра-ретким МОЕ, резултат је теоретски 10к већи проток за задатке на нивоу спремишта у поређењу са густим моделима сличног укупног капацитета.
Ова архитектура осигурава да агент може "читати" целу Питхон библиотеку или сложени ЈаваСцрипт оквир и реагују брзином 3Б модела, али са структурним разумевањем 80Б система.
Да би спречио халуцинацију контекста током тренинга, тим је користио најбоље паковање (БФП), стратегију која одржава ефикасност без грешака у скраћивању које се налазе у традиционалној конкатенацији докумената.
Обучен да буде први агент
Тхе "Следеће" у номенклатури модела се односи на фундаментални стожер методологије обуке. Историјски гледано, модели кодирања су били обучени на статичким паровима код-текст—у суштини а "само за читање" образовање. Квен3-Цодер-Нект је уместо тога развијен кроз масивни "агентичка обука" цевовод.
У техничком извештају је детаљно описан цевовод синтезе који је произвео 800.000 проверљивих задатака кодирања. То нису били само исечци; били су то сценарији за исправљање грешака у стварном свету извучени из захтева за повлачење на ГитХуб-у и упарени са потпуно извршним окружењима.
Инфраструктура за обуку, позната као МегаФлов, је систем оркестрације који је настао у облаку заснован на Алибаба Цлоуд Кубернетес-у. У МегаФлов-у, сваки агентски задатак је изражен као ток посла у три фазе: увођење агента, евалуација и накнадна обрада. Током увођења, модел је у интеракцији са живим контејнерским окружењем.
Ако генерише код који падне на тесту јединице или сруши контејнер, добија тренутну повратну информацију кроз обуку и учење уз помоћ. Ово "затворена петља" образовање омогућава моделу да учи из повратних информација окружења, учећи га да се опорави од грешака и побољша решења у реалном времену.
Спецификације производа укључују:
-
Подршка за 370 програмских језика: Проширење са 92 у претходним верзијама.
-
Позивање алатке у КСМЛ стилу: Нови формат квен3_цодер дизајниран за аргументе тешке низове, омогућавајући моделу да емитује дугачке исечке кода без угнежђеног цитирања и избегавања додатних трошкова типичних за ЈСОН.
-
Фокус на нивоу спремишта: Обука у средини је проширена на приближно 600Б токена података на нивоу спремишта, што се показало ефикаснијим за логику зависности међу датотекама него сами скупови података на нивоу датотеке.
Специјализација преко експертских модела
Кључна разлика у цевоводу Квен3-Цодер-Нект је употреба специјализованих модела стручњака. Уместо да обучава један генералистички модел за све задатке, тим је развио стручњаке специфичне за домен за веб развој и корисничко искуство (УКС).
Стручњак за веб развој циља на задатке пуног стека као што су конструкција корисничког интерфејса и састав компоненти. Сви узорци кода су приказани у Цхромиум окружењу које контролише драматург.
За Реацт узорке, Вите сервер је распоређен како би се осигурало да су све зависности исправно иницијализоване. Модел Висион-Лангуаге Модел (ВЛМ) је затим проценио приказане странице за интегритет изгледа и квалитет корисничког интерфејса.
Стручњак за корисничко искуство је оптимизован за придржавање формата за позивање алата кроз различите ЦЛИ/ИДЕ скеле као што су Цлине и ОпенЦоде. Тим је открио да је обука о различитим шаблонима за ћаскање са алаткама значајно побољшала робусност модела на невидљиве шеме у време примене.
Једном када су ови стручњаци постигли врхунске перформансе, њихове могућности су поново претворене у јединствени 80Б/3Б МОЕ модел. Ово осигурава да лагана верзија за примену задржава нијансирано знање много већих модела наставника.
Постизање стандарда уз високу сигурност
Резултати ове специјализоване обуке су очигледни у конкурентском положају модела у односу на гиганте индустрије. У бенчмарк евалуацијама спроведеним коришћењем скеле СВЕ-Агент, Квен3-Цодер-Нект је показао изузетну ефикасност у односу на број активних параметара.
На СВЕ-Бенцх Верифиед, модел је постигао резултат од 70,6%. Ове перформансе су нарочито конкурентне када се стављају поред значајно већих модела; надмашује ДеепСеек-В3.2, који има 70,2%, и тек незнатно заостаје за резултатом од 74,2% ГЛМ-4.7.
Оно што је најважније, модел демонстрира снажну инхерентну свест о безбедности. На СецЦодеБенцх-у, који процењује способност модела да поправи рањивости, Квен3-Цодер-Нект је надмашио Цлауде-Опус-4.5 у сценаријима генерисања кода (61,2% наспрам 52,5%).
Значајно је да је задржао високе резултате чак и када није добио никакве безбедносне наговештаје, што указује да је научио да предвиди уобичајене безбедносне замке током своје фазе агентске обуке од 800 хиљада задатака.
У вишејезичним вишејезичним безбедносним евалуацијама, модел је такође показао конкурентну равнотежу између функционалног и безбедног генерисања кода, надмашујући и ДеепСеек-В3.2 и ГЛМ-4.7 на ЦВЕвал бенцхмарк-у са фунц-сец@1 резултатом од 56,32%.
Изазивање власничких гиганта
Издање представља најзначајнији изазов за доминацију модела кодирања затвореног кода у 2026. Доказујући да модел са само 3Б активних параметара може да управља сложеношћу софтверског инжењеринга у стварном свету једнако ефикасно као и "гигант," Алибаба је ефективно демократизовала агентско кодирање.
Тхе "аха!" Тренутак за индустрију је схватање да су дужина контекста и проток две најважније полуге за успех агента.
Модел који може да обради 262.000 токена складишта у секунди и да верификује сопствени рад у Доцкер контејнеру је суштински кориснији од већег модела који је сувише спор или скуп за понављање.
Како Квен тим закључује у свом извештају: "Обука агента за скалирање, а не сама величина модела, је кључни покретач за унапређење способности агента за кодирање у стварном свету". Са Квен3-Цодер-Нект, ера "мамут" модел кодирања се можда ближи крају, замењујући га ултра-брзим, ретким стручњацима који могу да размишљају онолико дубоко колико могу да раде.


