Novac

Арцее има за циљ да поново покрене вештачку интелигенцију отвореног кода у САД са новим Тринити моделима објављеним под Апацхе 2.0

Већи део 2025. граница отворених језичких модела није дефинисана у Силиконској долини или Њујорку, већ у Пекингу и Хангџоуу.

Кинеске истраживачке лабораторије, укључујући Алибабин Квен, ДеепСеек, Моонсхот и Баиду, брзо су поставиле темпо у развоју великих, отворених модела Миктуре-оф-Екпертс (МоЕ) — често са дозвољеним лиценцама и водећим перформансама у бенчмарку. Док је ОпенАИ и овог лета представио свој ЛЛМ отвореног кода, опште намене – гпт-осс-20Б и 120Б – усвајање је успорило толико много алтернатива једнаког или бољег учинка.

Сада, једна мала америчка компанија гура назад.

Данас је Арцее АИ најавио издавање Тринити Мини и Тринити Нано Превиев, прва два модела у својој новој „Тринити“ породици—моделски пакет отвореног типа МоЕ који је у потпуности обучен у Сједињеним Државама.

Корисници могу да испробају први директно за себе у формату цхатбот-а на новој веб страници Ацрее-а, цхат.арцее.аи, а програмери могу преузети код за оба модела на Хуггинг Фаце-у и сами га покренути, као и да их модификују/фино подешавање по њиховом укусу — све бесплатно под Апацхе 2.0 лиценцом прилагођеном предузећима.

Иако су мала у поређењу са највећим граничним моделима, ова издања представљају редак покушај америчког стартапа да направи свеобухватне отворене моделе у скали – обучене од нуле, на америчкој инфраструктури, користећи цевовод скупа података који је курирао САД.

"Доживљавам комбинацију екстремног поноса на свој тим и исцрпљујуће исцрпљености, тако да се трудим да речима опишем колико сам узбуђена што имам ове моделе," написао је главни технолошки директор (ЦТО) компаније Арцее Луцас Аткинс у објави на друштвеној мрежи Кс (бивши Твитер). "Посебно Мини."

Трећи модел, Тринити Ларге, већ је у обуци: модел параметара од 420Б са 13Б активних параметара по токену, који би требало да буде лансиран у јануару 2026.

„Желимо да додамо нешто што је недостајало на тој слици“, написао је Аткинс у манифесту лансирања Тринитија објављеном на сајту Арцее. „Озбиљна породица модела отворених тежина обучена од краја до краја у Америци… коју предузећа и програмери заправо могу поседовати.

Од малих модела до скалираних амбиција

Пројекат Тринити означава прекретницу за Арцее АИ, који је до сада био познат по својим компактним моделима фокусираним на предузећа. Компанија је до данас прикупила 29,5 милиона долара у финансирању, укључујући 24 милиона долара Серије А у 2024. предвођену Емергенце Цапитал-ом, а њена претходна издања укључују АФМ-4.5Б, компактни модел прилагођен инструкцијама објављен средином 2025., и СуперНова, ранији модел са 70Б параметара дизајниран за праћење инструкција предузећа за праћење В.

Оба су била усмерена на решавање регулаторних и трошковних питања која муче усвајање власничког ЛЛМ-а у предузећу.

Са Тринитијем, Арцее има за циљ више: не само подешавање инструкција или пост-тренинг, већ и комплетну преттренинг модела отворене тежине – направљених за размишљање у дугом контексту, адаптацију синтетичких података и будућу интеграцију са системима за преобуку уживо.

Првобитно замишљени као одскочна даска за Тринити Ларге, и Мини и Нано су се појавили из раног експериментисања са ретким моделирањем и брзо су и сами постали производни циљеви.

Тецхницал Хигхлигхтс

Тринити Мини је модел параметара од 26Б са 3Б активних по токену, дизајниран за расуђивање велике пропусности, позивање функција и коришћење алата. Тринити Нано Превиев је модел параметара 6Б са отприлике 800М активних параметара који нису уграђени – експерименталнији модел фокусиран на ћаскање са јачом личношћу, али нижом отпорношћу расуђивања.

Оба модела користе Арцее-јеву нову архитектуру Аттентион-Фирст Миктуре-оф-Екпертс (АФМоЕ), прилагођени дизајн МОЕ који спаја глобалну реткост, локалну/глобалну пажњу и технике усмерене пажње.

Инспирисан недавним напретком ДеепСеек-а и Квен-а, АФМоЕ одступа од традиционалног МОЕ тако што чврсто интегрише ретко стручно рутирање са побољшаним скупом пажње — укључујући пажњу груписаног упита, усмерену пажњу и локални/глобални образац који побољшава резоновање дугог контекста.

Замислите типичан модел Министарства просвете као што је позивни центар са 128 специјализованих агената (званих „стручњаци“) — али само неколико се консултује за сваки позив, у зависности од питања. Ово штеди време и енергију, јер не мора сваки стручњак да одмерава.

Оно што чини АФМоЕ другачијим је како одлучује које агенте да позове и како комбинује њихове одговоре. Већина модела Министарства просвете користи стандардни приступ који бира стручњаке на основу једноставног рангирања.

АФМоЕ, насупрот томе, користи глаткију методу (названу сигмоидно рутирање) која више личи на подешавање точкића за јачину звука него на окретање прекидача – омогућавајући моделу да елегантније меша више перспектива.

Део „прва пажња“ значи да се модел у великој мери фокусира на то како обраћа пажњу на различите делове разговора. Замислите да читате роман и памтите неке делове јасније од других на основу важности, недавности или емоционалног утицаја – то је пажња. АФМоЕ ово побољшава комбиновањем локалне пажње (фокусирање на оно што је управо речено) са глобалном пажњом (сећање на кључне тачке од раније), користећи ритам који одржава равнотежу ствари.

Коначно, АФМоЕ уводи нешто што се зове ограничена пажња, која делује као контрола јачине звука на сваком излазу пажње — помажући моделу да нагласи или пригуши различите делове информација по потреби, као што је подешавање колико вам је стало до сваког гласа у групној дискусији.

Све ово је дизајнирано да учини модел стабилнијим током обуке и ефикаснијим у обиму — тако да може да разуме дуже разговоре, јасније размишља и ради брже без потребе за огромним рачунарским ресурсима.

За разлику од многих постојећих МОЕ имплементација, АФМоЕ наглашава стабилност на дубини и ефикасност обуке, користећи технике као што су рутирање засновано на сигмоидима без помоћних губитака и нормализација са скалом дубине да би се подржало скалирање без дивергенције.

Могућности модела

Тринити Мини усваја архитектуру Министарства образовања са 128 стручњака, 8 активних по токену и 1 увек укљученим дељеним стручњаком. Прозори контекста достижу до 131.072 токена, у зависности од провајдера.

Мерила показују да Тринити Мини делује конкурентно са већим моделима у свим задацима расуђивања, укључујући надмашивање гпт-осс на СимплеКА бенцхмарк-у (тестира памћење чињеница и да ли модел признаје несигурност), ММЛУ (Нулти снимак, мерење широког академског знања и расуђивања у многим предметима без примера за расуђивање), и реалног позива на алате В3- и Б. користити):

  • ММЛУ (зеро-схот): 84.95

  • Математика-500: 92.10

  • ГПКА-дијамант: 58.55

  • БФЦЛ В3: 59.67

Број кашњења и протока код провајдера као што су Тогетхер и Цларифаи показују проток од 200+ токена у секунди са Е2Е латенцијом испод три секунде – што Тринити Мини чини одрживим за интерактивне апликације и цевоводе агената.

Тринити Нано, иако је мањи и није тако стабилан на рубним случајевима, показује ретку одрживост архитектуре МоЕ са испод 1Б активних параметара по токену.

Приступ, цене и интеграција екосистема

Оба Тринити модела су издата под дозвољеним, прилагођеним предузећима, Апацхе 2.0 лиценцаомогућавајући неограничену комерцијалну и истраживачку употребу. Тринити Мини је доступан преко:

  • Хуггинг Фаце

  • ОпенРоутер

  • цхат.арцее.аи

АПИ цене за Тринити Мини преко ОпенРоутера:

  • 0,045 долара за милион улазних токена

  • 0,15 долара за милион излазних токена

  • Бесплатан ниво доступан је ограничено време на ОпенРоутер-у

Модел је већ интегрисан у апликације укључујући Бенцхабле.аи, Опен ВебУИ и СиллиТаверн. Подржан је у Хуггинг Фаце Трансформерс, ВЛЛМ, ЛМ Студио и ллама.цпп.

Подаци без компромиса: улога ДатологиАИ

Централно у Арцее-овом приступу је контрола над подацима о обуци – оштар контраст многим отвореним моделима обученим на скуповима података који су прегледани на вебу или правно двосмислени. Ту ДатологиАИ, стартуп за прикупљање података, који је суоснивач бивши истраживач Мета и ДеепМинд Ари Морцос, игра кључну улогу.

Платформа ДатологиАИ аутоматизује филтрирање података, дедупликацију и побољшање квалитета у свим модалитетима, осигуравајући да Арцее-ов корпус обуке избегава замке бучног, пристрасног садржаја или садржаја који угрожава ауторска права.

За Тринити, ДатологиАИ је помогао у изради наставног плана и програма од 10 трилиона токена организованог у три фазе: 7Т општи подаци, 1,8Т висококвалитетни текст и 1,2Т материјал тежак СТЕМ, укључујући математику и код.

Ово је исто партнерство које је покретало Арцее-ов АФМ-4.5Б — али је значајно смањено и по величини и по сложености. Према Арцее-ју, алати за филтрирање и рангирање података компаније Датологи омогућили су Тринити-ју да се јасно скалира док истовремено побољшава перформансе на задацима као што су математика, КА и употреба алата за агенте.

Допринос датологије се такође протеже на генерисање синтетичких података. За Тринити Ларге, компанија је произвела преко 10 трилиона синтетичких токена—упарене са 10Т курираним веб токенима—како би формирала корпус обуке од 20Т токена за модел пуне скале који је сада у току.

Изградња инфраструктуре за такмичење: врхунски интелект

Арцеејева способност да спроведе обуку у пуном обиму у САД је такође захваљујући свом инфраструктурном партнеру, Приме Интеллецту. Стартап, основан почетком 2024. године, започео је са мисијом да демократизује приступ АИ рачунарству изградњом децентрализованог ГПУ тржишта и групе за обуку.

Док је Приме Интеллецт доспео на насловне стране са својом дистрибуираном обуком ИНТЕЛЛЕЦТ-1—моделом параметара од 10Б који је обучен међу сарадницима у пет земаља— његов новији рад, укључујући 106Б ИНТЕЛЛЕЦТ-3, признаје компромисе обима: дистрибуирана обука, али за 100Б+ моделе, централизована инфраструктура је и даље ефикаснија.

За Тринити Мини и Нано, Приме Интеллецт је обезбедио стек оркестрације, модификовано време извођења ТорцхТитан-а и физичко рачунарско окружење: 512 Х200 ГПУ-а у прилагођеном бф16 цевоводу, који покреће високоефикасни ХСДП паралелизам. Такође је домаћин 2048 Б300 ГПУ кластера који се користи за обуку Тринити Ларге-а.

Сарадња показује разлику између брендирања и извршења. Док дугорочни циљ Приме Интеллецта остаје децентрализовано рачунарство, његова краткорочна вредност за Арцее лежи у ефикасној, транспарентној инфраструктури за обуку — инфраструктури која остаје под јурисдикцијом САД, са познатим пореклом и безбедносним контролама.

Стратешка опклада на модел суверенитета

Арцее-јев притисак на пуну претходну обуку одражава ширу тезу: да ће будућност АИ у предузећу зависити од поседовања петље обуке — не само од финог подешавања. Како се системи развијају тако да се прилагођавају живој употреби и аутономно ступају у интеракцију са алатима, усклађеност и контрола над циљевима обуке биће важни колико и учинак.

„Како апликације постају све амбициозније, граница између ‘модела’ и ‘производа’ наставља да се помера,“ приметио је Аткинс у Арцеејевом Тринити манифесту. „Да бисте направили такву врсту софтвера, морате да контролишете тежине и цевовод за обуку, а не само слој инструкција.

Ово уоквиривање издваја Тринити од других напора отворене тежине. Уместо да крпи нечији основни модел, Арцее је изградио сопствени – од података до примене, инфраструктуре до оптимизатора – заједно са партнерима који деле ту визију отворености и суверенитета.

Гледање унапред: Тринити Ларге

Обука је тренутно у току за Тринити Ларге, Арцее-јев 420Б параметарски модел МоЕ, користећи исту афмое архитектуру скалирану на већи скуп стручњака.

Скуп података укључује 20Т токена, равномерно подељених између синтетичких података из ДатологиАИ и курираних вб података.

Очекује се да ће модел бити лансиран следећег месеца у јануару 2026. године, а комплетан технички извештај ће уследити убрзо након тога.

Ако буде успешан, то би учинило Тринити Ларге једним од јединих потпуно отворених, обучених у САД модела, позиционирајући Арси као озбиљног играча у отвореном екосистему у време када је већина америчких ЛЛМ напора или затворена или заснована на не-америчким фондацијама.

Поново посвећеност америчком отвореном коду

У пејзажу где кинеске истраживачке лабораторије све више обликују најамбициозније моделе отворене тежине, лансирање Арцее Тринити сигнализира ретку промену у правцу: покушај да се поврати терен за транспарентан развој модела који контролише САД.

Уз подршку специјализованих партнера у области података и инфраструктуре, и изграђен од нуле за дугорочну прилагодљивост, Тринити је храбра изјава о будућности развоја вештачке интелигенције у САД, показујући да мале, мање познате компаније и даље могу да померају границе и иновирају на отворен начин, чак и када се индустрија све више производи и производи.

Оно што остаје да се види је да ли Тринити Ларге може да парира могућностима својих боље финансираних колега. Али пошто су Мини и Нано већ у употреби и јака архитектонска основа, Арцее можда већ доказује своју централну тезу: да ће суверенитет модела, а не само величина модела, дефинисати следећу еру АИ.

Related Articles

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button