Novac

з.аи-јев опен соурце ГЛМ-5 постиже рекордно ниску стопу халуцинација и користи нову РЛ технику ‘љигавости’

Кинески АИ стартуп Зхупаи ака з.аи се вратио ове недеље са новим граничним моделом великог језика који боде око: ГЛМ-5.

Најновија у з.аи-овој континуираној и импресивној ГЛМ серији, она задржава МИТ лиценцу отвореног кода — савршену за примену у предузећима — и, у једном од неколико значајних достигнућа, постиже рекордно ниску стопу халуцинација на независним Индекс вештачке анализе интелигенције в4.0.

Са оценом -1 на АА-индексу свезнања – што представља огромно побољшање од 35 поена у односу на свог претходника – ГЛМ-5 сада води целу индустрију вештачке интелигенције, укључујући америчке конкуренте као што су Гоогле, ОпенАИ и Антхропиц, у поузданости знања знајући када треба да се уздржи уместо да измишља информације.

Поред своје способности расуђивања, ГЛМ-5 је направљен за рад са високим знањем. Карактерише га нативе "Агент Моде" могућности које му омогућавају да претвори необрађене упите или изворне материјале директно у професионалне канцеларијске документе, укључујући спремне за употребу .docx, .pdfи .xlsx датотеке.

Било да генерише детаљне финансијске извештаје, предлоге за спонзорство у средњим школама или сложене табеле, ГЛМ-5 даје резултате у реалним форматима који се интегришу директно у пословне токове предузећа.

Такође има реметилачку цену од отприлике 0,80 УСД за милион улазних токена и 2,56 УСД за милион излазних токена, што је отприлике 6 пута јефтиније од власничких конкурената као што је Цлауде Опус 4.6, чинећи најсавременији агентски инжењеринг исплативијим него икада раније. Ево шта би још доносиоци одлука у предузећу требало да знају о моделу и његовој обуци.

Технологија: скалирање ради ефикасности агената

У срцу ГЛМ-5 је огроман скок у сировим параметрима. Модел се скалира од 355Б параметара ГЛМ-4.5 до запањујућих 744Б параметара, са 40Б активних по токену у његовој архитектури Миктуре-оф-Екпертс (МоЕ). Овај раст је подржан повећањем података пре обуке на 28,5Т токена.

Да би се позабавио неефикасношћу обуке у овој величини, Заи се развио "слузи," нова инфраструктура за асинхроно учење са појачањем (РЛ).

Традиционални РЛ често пати од "дугореп" уска грла; Слиме прекида овај корак тако што дозвољава да се трајекторије генеришу независно, омогућавајући фино зрнасте итерације неопходне за сложено агентско понашање.

Интеграцијом оптимизација на нивоу система као што је Ацтиве Партиал Роллоутс (АПРИЛ), слиме решава уска грла генерације која обично троше преко 90% времена обуке РЛ, значајно убрзавајући циклус итерације за сложене агентске задатке.

Дизајн оквира је усредсређен на троделни модуларни систем: модул за обуку високих перформанси који покреће Мегатрон-ЛМ, модул за увођење који користи СГЛанг и прилагођене рутере за генерисање података велике пропусности и централизовани бафер података који управља брзом иницијализацијом и складиштењем.

Омогућавајући прилагодљива проверљива окружења и повратне петље за компилацију са више обртаја, слиме обезбеђује робусну основу високе пропусности неопходну за прелазак АИ са једноставних интеракција ћаскања на ригорозни системски инжењеринг дугог хоризонта.

Да би имплементација била управљива, ГЛМ-5 интегрише ДеепСеек Спарсе Аттентион (ДСА), чувајући капацитет контекста од 200К уз драстично смањење трошкова.

Рад знања од краја до краја

Заи уоквирује ГЛМ-5 као "канцеларија" алат за АГИ еру. Док су се претходни модели фокусирали на исечке, ГЛМ-5 је направљен да испоручује документе спремне за употребу.

Може аутономно да трансформише упите у форматиране .доцк, .пдф и .клск датотеке—у распону од финансијских извештаја до предлога за спонзорство.

У пракси, то значи да модел може да разложи циљеве високог нивоа на подзадатке који се могу извршити и извршити "агентски инжењеринг," где људи дефинишу капије квалитета док АИ управља извршењем.

Високе перформансе

Репери ГЛМ-5 чине га новим најмоћнијим моделом отвореног кода на свету, према Вештачка анализанадмашујући Кими К2.5 Кими К2.5 кинеског ривала Моонсхот-а објављен пре само две недеље, показујући да су кинеске компаније са вештачком интелигенцијом скоро сустигле далеко боље ресурсе сопствених западних ривала.

Према з.аи-јевим материјалима који су данас подељени, ГЛМ-5 се рангира близу најсавременијег нивоа на неколико кључних мерила:

СВЕ-клупа Верификовано: ГЛМ-5 је постигао резултат од 77,8, надмашивши Гемини 3 Про (76,2) и приближивши се Цлауде Опусу 4,6 (80,9).

Продајна клупа 2: У симулацији вођења посла, ГЛМ-5 је рангиран као број 1 међу моделима отвореног кода са коначним стањем од 4.432,12 долара.

Осим перформанси, ГЛМ-5 агресивно поткопава тржиште. Уживо на ОпенРоутер-у од 11. фебруара 2026. има цену од приближно 0,80 до 1,00 долара за милион улазних токена и 2,56 до 3,20 долара за милион излазних токена. Спада у средњи опсег у поређењу са другим водећим ЛЛМ-овима, али на основу његових врхунских перформанси бецхмаркинга, то је оно што би се могло назвати "красти."

Модел

Унос (по 1М токена)

Излаз (по 1М токена)

Укупни трошкови (1 милион улаза + 1 милион излаза)

Извор

Квен 3 Турбо

0,05 $

0,20 долара

0,25 долара

Алибаба Цлоуд

Грок 4.1 Фаст (расуђивање)

0,20 долара

0,50 долара

0,70 долара

кАИ

Грок 4.1 Брзи (без расуђивања)

0,20 долара

0,50 долара

0,70 долара

кАИ

деепсеек-цхат (В3.2-Екп)

0,28 долара

0,42 долара

0,70 долара

ДеепСеек

деепсеек-реасонер (В3.2-Екп)

0,28 долара

0,42 долара

0,70 долара

ДеепСеек

Гемини 3 Фласх Превиев

0,50 долара

$3.00

3,50 долара

Гоогле

Кими-к2.5

0,60 долара

$3.00

3,60 долара

Моонсхот

ГЛМ-5

$1.00

3,20 долара

4,20 долара

З.аи

ЕРНИЕ 5.0

0,85 долара

3,40 долара

4,25 долара

Кианфан

Клод Хаику 4.5

$1.00

5,00 долара

6,00 долара

Антропски

Квен3-Мак (23.01.2026.)

1,20 долара

6,00 долара

7,20 долара

Алибаба Цлоуд

Гемини 3 Про (≤200К)

$2.00

$12.00

14,00 долара

Гоогле

ГПТ-5.2

1,75 долара

14,00 долара

15,75 долара

ОпенАИ

Клод Сонет 4.5

$3.00

$15.00

18,00 долара

Антропски

Гемини 3 Про (>200К)

$4.00

18,00 долара

$22.00

Гоогле

Цлауде Опус 4.6

5,00 долара

$25.00

$30,00

Антропски

ГПТ-5.2 Про

$21.00

$168.00

189,00 долара

ОпенАИ

Ово је отприлике 6 пута јефтиније на улазу и скоро 10 пута јефтиније на излазу од Цлауде Опус 4.6 (5 УСД/25 УСД). Ово издање потврђује гласине да је Зхипу АИ стајао иза "Пони Алфа," стелт модел који је претходно уништио стандарде кодирања на ОпенРоутеру.

Међутим, упркос високим стандардима и ниској цени, нису сви рани корисници одушевљени моделом, примећујући да његове високе перформансе не говоре целу причу.

Лукас Петерссон, суоснивач покретања аутономног АИ протокола фокусираног на сигурност Андон Лабс, приметио на Кс: "После сати читања трагова ГЛМ-5: невероватно ефикасан модел, али далеко мање свестан ситуације. Постиже циљеве агресивном тактиком, али не размишља о својој ситуацији нити користи искуство. Ово је страшно. Овако добијате максималну спајалицу."

Тхе "спајалица максимизатор" односи се на хипотетичку ситуацију описао оксфордски филозоф Ник Бостром још 2003. годинеу којој вештачка интелигенција или друга аутономна творевина случајно доводе до апокалиптичног сценарија или изумирања човека пратећи наизглед бенигне инструкције — као што је максимизирање броја произведених спајалица — до екстремног степена, преусмеравање свих ресурса неопходних за људски (или други живот) или на други начин онемогућавајући живот кроз своју посвећеност испуњењу наизглед доброг циља.

Да ли ваше предузеће треба да усвоји ГЛМ-5?

Предузећа која желе да избегну закључавање добављача наћи ће ГЛМ-5 МИТ лиценцу и доступност отворених тежина као значајну стратешку предност. За разлику од конкурената затвореног кода који чувају обавештајне податке иза власничких зидова, ГЛМ-5 омогућава организацијама да угосте сопствене обавештајне податке на граничном нивоу.

Усвајање није без трвења. Огромна скала параметара ГЛМ-5—744Б—захтева огроман хардверски под који може бити недостижан за мање компаније без значајних кластера у облаку или локалних ГПУ кластера.

Безбедносни лидери морају да одвагају геополитичке импликације водећег модела из лабораторије са седиштем у Кини, посебно у регулисаним индустријама где се резидентност и порекло података строго проверава.

Штавише, померање ка аутономнијим АИ агентима уводи нове ризике управљања. Како се модели крећу из "цхат" да "рад," почињу да раде у апликацијама и датотекама аутономно. Без робусних дозвола специфичних за агенте и капија квалитета „људи у петљи“ које су успоставили лидери података у предузећу, ризик од аутономне грешке експоненцијално расте.

На крају крајева, ГЛМ-5 је а "купити" за организације које су прерасле једноставне копилоте и спремне су да изграде истински аутономну канцеларију.

Намењен је инжењерима који треба да рефакторишу застарели бацкенд или захтевају а "самоизлечење" цевовод који не спава.

Док западне лабораторије настављају да оптимизују за "Размишљање" и дубина размишљања, Заи оптимизује за извршење и обим.

Предузећа која данас усвајају ГЛМ-5 не купују само јефтинији модел; они се кладе на будућност у којој је највреднија вештачка интелигенција она која може да заврши пројекат без два питања.

извор линк

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button