Арцее-ов амерички Тринити Ларге отвореног кода и контролна тачка од 10Т нуде редак поглед на сирову интелигенцију модела


Лабораторија вештачке интелигенције са седиштем у Сан Франциску Арцее направила талас прошле године због тога што је била једна од јединих америчких компанија која је обучавала велике језичке моделе (ЛЛМ) од нуле и пустила их под лиценцама отвореног или делимично отвореног кода за јавност – омогућавајући програмерима, соло предузетницима, па чак и средњим до великим предузећима да бесплатно користе моћне АИ моделе и прилагођавају их по жељи.
Сада се Арцее поново вратио ове недеље са издавањем свог највећег, најефикаснијег модела отвореног језика до сада: Тринити Ларгемешавина стручњака од 400 милијарди параметара (МоЕ), доступна у прегледу,
Поред водећег издања, Арцее испоручује а "сирово" модел контролне тачке, Тринити-Ларге-ТруеБасешто омогућава истраживачима да проуче шта 400Б ретко МОЕ учи само из сирових података, пре него што се примени подешавање и појачање инструкција.
Пружајући чисту листу од 10 трилиона токена, Арцее омогућава градитељима вештачке интелигенције у високо регулисаним индустријама да врше аутентичне ревизије и спроводе сопствена специјализована усклађивања без наслеђивања "црна кутија" пристрасности или необичне форме модела ћаскања опште намене. Ова транспарентност омогућава дубље разумевање разлике између интринзичних способности расуђивања модела и корисних понашања који се користе током завршних фаза пост-тренинга.
Ово лансирање стиже пошто су моћне кинеске ЛЛМ алтернативе отвореног кода попут Алибаба (Квен), з.АИ (Зхипу), ДеепСеек, Моонсхот и Баиду преплавиле тржиште, ефективно водећи у категорији са високо ефикасним архитектурама.
Тринити Ларге такође долази након што се Мета значајно повукао из граничног пејзажа отвореног кода. Након дебија Лламе 4 у априлу 2025., који је наишао на мешовити пријем, а касније и бивши истраживач Мета АИ Ианн ЛеЦун признао је да је компанија користила више специјализованих верзија модела да повећа резултате на референтним вредностима трећих страна.
Усред овог домаћег вакуума, само ОпенАИ — са својом гпт-осс породицом објављеном у лето 2025. — и Арцее тренутно носе плашт нових модела отвореног кода произведених у САД који су обучени у потпуности од нуле.
Колико год да су ретки
Тринити Ларге је вредан пажње због екстремне оскудности свог механизма пажње. Архитектура Министарства просвете, "реткост" односи се на способност модела да селективно активира само мали део својих укупних параметара за било који дати задатак.
Док Тринити Ларге садржи 400Б укупних параметара, само 1,56% (13Б параметара) је активно у било ком тренутку.
Овај архитектонски избор је значајан јер омогућава моделу да поседује "знања" масивног система уз задржавање брзине закључивања и оперативне ефикасности много мањег система – постижући перформансе које су отприлике 2–3 пута брже од својих колега на истом хардверу.
Суверенитет и "ТруеБасе" филозофија
Најзначајнији допринос овог издања истраживачкој заједници је Тринити-Ларге-ТруеБасе—необрађена контролна тачка од 10 трилиона токена.
За разлику од скоро свих других "отворен" ослобађање, које стиже после бив "искривљена" подешавањем инструкција и учењем са појачавањем, ТруеБасе нуди редак, неискварен поглед на основну интелигенцију.
У журби да учине моделе корисним, већина лабораторија примењује надгледано фино подешавање (СФТ) и учење за појачавање из људских повратних информација (РЛХФ) пре него што се тегови објаве. Иако ово чини модел бољим саговорником, он може прикрити основне дистрибуције знања.
ТруеБасе пружа ан "ОГ основни модел" која још није прошла кроз процес учења стопе учења или другу и трећу фазу пре обуке где се типично уводе подаци о инструкцији.
За истраживаче и предузећа у високо регулисаним индустријама, почевши од ТруеБасе-а омогућава аутентичне ревизије и прилагођено усклађивање. Као што је Луцас Аткинс, Арцеејев ЦТО, приметио у видео позиву са ВентуреБеат: "Занимљиво је да је сам контролни пункт већ један од најбољих модела базних модела на свету".
Технологија: инжењеринг кроз ограничење
Стварање Тринити Ларге-а није био производ бесконачних ресурса, већ оно што Аткинс назива "инжењеринг кроз ограничење".
Обучен за око 20 милиона долара током само 33 дана, модел представља мајсторску класу ефикасности капитала.
Арцее, тим од само 30 људи, управљао је укупним капиталом од нешто мање од 50 милиона долара, чинећи обуку од 20 милиона долара "назад компанију" кладити се.
"Увек сам веровао да је ограничење, било финансијско или кадровско или било шта друго, изузетно важно за креативност," Аткинс је објаснио. "Када имате само неограничен буџет, сами по себи не морате да осмишљавате свој излаз из сложених проблема".
Архитектура: 4-од-256 Спарсити и СМЕБУ
Тринити Ларге користи ретку архитектуру МоЕ 4 од 256, што значи да активира само 4 од својих 256 стручњака за сваки токен.
Овај висок степен реткости — један од највиших икада успешно обучених — створио је значајне изазове стабилности током пре-тренинга.
Да би ово решио, Арцее је развио Софт-цлампед Моментум Екперт Биас Упдатес (СМЕБУ). Овај механизам осигурава да су стручњаци специјализовани и равномерно усмеравани по општем веб корпусу, спречавајући неколико стручњака да постану "победници" док други остају необучени "мртва тежина".
Брзина тренинга је олакшана Арцее-јевим раним приступом Нвидиа Б300 ГПУ-овима (Блацквелл). Ови чипови су обезбедили отприлике дупло већу брзину од претходне Хоппер генерације и значајно повећање меморије.
"Предтренинг је трајао 33 дана," Аткинс је приметио. "Могли смо то да урадимо на Хопперу, и вероватно би требало два до три месеца. И до тог тренутка, ми смо у потпуно новој генерацији модела".
У партнерству са ДатологиАИАрцее је користио преко 8 трилиона токена синтетичких података. Међутим, ово није било типично "имитација" синтетички подаци где мањи модел учи да говори као већи.
Уместо тога, намера је била да се узме сирови веб текст — као што су блогови или чланци на Википедији — и да се синтетички препише како би се информације сажимале у мањи број укупних токена. Овај процес је помогао моделу да научи да размишља о информацијама, а не само да памти тачне низове токена.
Архитектонски дизајн такође укључује наизменичне локалне и глобалне слојеве пажње клизног прозора у односу 3:1. Овај хибридни приступ омогућава моделу да буде веома ефикасан у сценаријима дугог контекста. Иако је обучен за дужину секвенце од 256к, Тринити Ларге изворно подржава контекст од 512к, а процене сугеришу да остаје ефикасан чак и на хоризонту од 1 милион токена.
Техничко поређење: Тринити Ларге наспрам гпт-осс-120б
Као америчка алтернатива, Тринити Ларге се може упоредити са ОпенАИ-овим гпт-осс-120б.
Иако оба модела користе ретке архитектуре за постизање перформанси на граничном нивоу под дозвољеним лиценцама, они служе различитим оперативним улогама.
Док гпт-осс-120б тренутно има предност у специфичном резоновању и математичким мерилима, Тринити Ларге нуди значајну предност у капацитету контекста и дубини сирових параметара за сложене агентске токове рада у више корака.
Суверенитет: попуњавање вакуума
Издавање Тринити Ларге-а је подједнако геополитичка изјава колико и техничка. Извршни директор Марк МцКуаде је приметио за ВентуреБеат у истом интервјуу да је вакуум америчких модела отвореног кода на граничном нивоу приморао на преокрет у Арцееовој стратегији.
"Дошло је до ове врсте промене где су амерички или западни играчи престали да отварају изворе ових модела," МцКуаде је рекао. "Ослањамо се на ове моделе да бисмо затим ушли у организације и одвели их даље… али кинеске лабораторије су тек почеле… да производе врхунске моделе и отварају их изворима".
За МцКуадеа, ово је створило зависност због које су америчка предузећа била све неугоднија. "Посебно у разговору који водимо са великим организацијама, оне нису могле да користе кинеске архитектуре," објаснио је. "Желимо да будемо тај шампион у САД. [It] заправо тренутно не постоји".
Објављивањем под лиценцом Апацхе 2.0, Арцее обезбеђује оквир за дозвољени златни стандард који омогућава компанијама да "сопствени" слој модела у потпуности. Ово је кључно за индустрије као што су финансије и одбрана, где коришћење модела који хостује трећа страна или рестриктивни провајдер у облаку није почетник.
Баланс између интелигенције и корисности
Арцее се тренутно фокусира на "актуелни модел размишљања" за транзицију Тринити Ларге из општег модела инструкција у модел пуног расуђивања. Тим се бори са равнотежом између "интелигенција наспрам корисности"—тежња да се створи модел који се истиче у мерилима, а да не постане "иаппи" или неефикасна у стварним производним применама.
"Изградили смо Тринити тако да можете да га поседујете," тим наводи, сигнализирајући повратак темељним вредностима америчког покрета отвореног кода. Како се индустрија креће ка агентским токовима посла и огромним захтевима контекста, Тринити Ларге се позиционира не као "омотач," већ као суверени инфраструктурни слој који програмери коначно могу да контролишу.


