Novac

Први утисци Гоогле Гемини 3.1 Про: „Дееп Тхинк Мини“ са прилагодљивим образложењем на захтев

У последња три месеца, Гоогле Гемини 3 Про се држао као један од најспособнијих граничних модела доступних. Али у свету вештачке интелигенције која се брзо креће, три месеца су цео живот — а конкуренти не стоје мирно.

Раније данас, Гоогле је објавио Гемини 3.1 Проажурирање које доноси кључну иновацију у модел снаге радне снаге компаније: три нивоа прилагодљивог размишљања који га ефективно претварају у лагану верзију Гоогле-овог специјализованог система за размишљање Дееп Тхинк.

Издање је први пут да је Гоогле издао а "тачка један" ажурирање на Гемини модел, сигнализирајући помак у стратегији издавања компаније са периодичних лансирања пуне верзије на чешћа постепена надоградња. Што је још важније за корпоративне АИ тимове који процењују свој скуп модела, нови трослојни систем размишљања 3.1 Про – низак, средњи и висок – даје програмерима и ИТ лидерима један модел који може динамички да скалира своје напоре у размишљању, од брзих одговора на рутинске упите до вишеминутних сесија дубоког резоновања за сложене проблеме.

Модел се сада приказује у прегледу преко Гемини АПИ-ја Гоогле АИ СтудиоГемини ЦЛИ, Гоогле-ова агентска развојна платформа Антигравити, Вертек АИ, Гемини Ентерприсе, Андроид Студио, потрошачка апликација Гемини и НотебоокЛМ.

Ефекат ‘Дееп Тхинк Мини’: прилагодљиво размишљање на захтев

Најважнија карактеристика у Гемини 3.1 Про није један референтни број – то је увођење трослојног система размишљања који корисницима даје фину контролу над тим колико рачунског напора модел улаже у сваки одговор.

Гемини 3 Про је нудио само два начина размишљања: ниски и високи. Нови 3.1 Про додаје средњу поставку (слично претходном високом) и, што је критично, преправља оно што "висока" значи. Када је постављен на високо, 3.1 Про се понаша као а "мини верзија Гемини Дееп Тхинк" — специјализовани модел резоновања компаније који је био ажуриран само прошле недеље.

Импликације за примену предузећа могу бити значајне. Уместо да усмеравају захтеве ка различитим специјализованим моделима на основу сложености задатка – уобичајеног, али оперативно оптерећујућег обрасца – организације сада могу да користе једну крајњу тачку модела и прилагођавају дубину размишљања на основу задатка који је при руци. Рутинско сажимање докумената може да се одвија на ниском нивоу размишљања са брзим временом одзива, док се сложени аналитички задаци могу уздигнути до високог размишљања за дубоко размишљање.

Референтне перформансе: више од удвостручења Реасонинг Овер 3 Про

Гоогле-ови објављени референтни показатељи говоре причу о драматичном побољшању, посебно у областима које су повезане са расуђивањем и агентурном способношћу.

Он АРЦ-АГИ-2бенцхмарк који процењује способност модела да реши нове апстрактне обрасце резоновања, 3.1 Про резултат 77,1% — више него дупло више од 31,1% које је постигао Гемини 3 Про и знатно испред Антхропицовог Сонета 4.6 (58.3%) и Опуса 4.6 (68.8%). Овај резултат такође надмашује ОпенАИ ГПТ-5.2 (52,9%).

Добици се протежу на све стране. Он Последњи испит човечанстваригорозно академско резоновање, 3.1 Про је постигао 44,4% без алата, у односу на 37,5% за 3 Про и испред и Цлауде Соннет 4.6 (33.2%) и Опус 4.6 (40.0%). Он ГПКА Диамондпроцена научног знања, 3.1 Про достигла је 94,3%, надмашујући све наведене конкуренте.

Тамо где резултати постају посебно релевантни за корпоративне АИ тимове су у агентским мерилима — евалуацијама које мере колико добро модели раде када им се дају алати и задаци у више корака, врста посла која све више дефинише примену производне АИ.

Он Терминал-Бенцх 2.0који процењује кодирање агентског терминала, 3.1 Про је постигао 68,5% у поређењу са 56,9% за свог претходника. Он МЦП Атласбенцхмарк који мери токове рада у више корака користећи протокол контекста модела, 3.1 Про је достигао 69,2% — побољшање од 15 поена у односу на 54,1% код 3 Про и скоро 10 поена испред Цлаудеа и ГПТ-5.2. И даље БровсеЦомпкоји тестира способност агентске веб претраге, 3.1 Про је постигао 85,9%, надмашивши 3 Про 59,2%.

Зашто је Гоогле изабрао ‘0.1’ издање — и шта оно сигнализира

Одлука о верзији је сама по себи вредна пажње. Претходна Гемини издања су пратила образац застарелих прегледа — вишеструки 2.5 прегледи, на пример, пре него што су постали општа доступност. Избор да се ово ажурирање означи као 3.1, а не као други 3 Про преглед, сугерише да Гоогле види побољшања као довољно значајна да гарантује повећање верзије, док "тачка један" кадрирање поставља очекивања да је ово еволуција, а не револуција.

У Гоогле-овом блогу се наводи да се 3.1 Про гради директно на лекцијама из серије Гемини Дееп Тхинк, укључујући технике из ранијих и новијих верзија. Мерила снажно сугеришу да је учење са појачањем одиграло централну улогу у добицима, посебно на задацима као што су АРЦ-АГИ-2, референтне вредности кодирања и агентске евалуације — управо у доменима у којима окружења за обуку заснована на РЛ могу пружити јасне сигнале награде.

Модел се објављује у прегледу, а не као опште доступност, а Гоогле наводи да ће наставити да напредује у областима као што су агентски токови посла пре него што пређе на пуну ГА.

Конкурентне импликације за АИ стацк вашег предузећа

За доносиоце ИТ одлука који процењују граничне добављаче модела, издање Гемини 3.1 Про мора не само да их натера да преиспитају које моделе да изаберу, већ и како да се прилагоде тако брзом темпу промена за сопствене производе и услуге.

Питање је сада да ли ово издање изазива одговор конкурената. Оригинално лансирање Гемини 3 Про прошлог новембра покренуло је талас издања модела у власничким и отвореним екосистемима.

Са 3.1 Про који је повратио лидерство у референтним стандардима у неколико критичних категорија, притисак је на Антхропиц, ОпенАИ и заједницу отворених тежина да реагују — а у тренутном окружењу вештачке интелигенције, тај одговор се вероватно мери недељама, а не месецима.

Доступност

Гемини 3.1 Про је сада доступан у прегледу преко Гемини АПИ у Гоогле АИ студију, Гемини ЦЛИ, Гоогле Антигравити и Андроид студију за програмере. Пословни корисници могу да му приступе преко Вертек АИ и Гемини Ентерприсе. Потрошачи на Гоогле АИ Про и Ултра плановима могу му приступити преко апликације Гемини и НотебоокЛМ-а.

извор линк

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button