Novac

Гоогле издаје Гемини 3.1 Про: Бенцхмаркс, како то испробати

Гоогле је у четвртак објавио свој најновији основни модел размишљања, Гемини 3.1 Про. Гоогле каже да је Гемини 3.1 Про постигао двоструко више верификованих перформанси од 3 Про на АРЦ-АГИ-2, популарном бенцхмарк-у који мери логичко резоновање модела.

Гоогле је првобитно објавио Гемини 3 и 3 Про у новембру, а ово ново издање показује колико брзо АИ компаније уводе нове и ажуриране моделе. Гемини 3.1 Про је нови основни модел који покреће Гемини и разне Гоогле АИ алате, као што је Гемини 3 Дееп Тхинк. Гоогле каже да је дизајниран да пружи креативнија решења.

„3.1 Про је дизајниран за задатке где једноставан одговор није довољан, узимајући напредно резоновање и чини га корисним за ваше најтеже изазове“, а Гоогле пост на блогу државе. „Ова побољшана интелигенција може помоћи у практичним применама — било да тражите јасно, визуелно објашњење сложене теме, начин да синтетишете податке у један приказ или оживите креативни пројекат.

ВИДИ ТАКОЂЕ:

ГПТ-5.2 наспрам Гемини 3 — Како се два тешка модела пореде на основу референтних вредности, цене и скупа функција

Ево свега што до сада знамо о Гемини 3.1 Про, укључујући како се он пореди са најновијим моделима из Антхропиц и ОпенАИ, и како да га сами испробате.

Како испробати Гемини 3.1 Про

Од данас, Гоогле уводи Гемини 3.1 Про у Гемини Апп, Гемини АПИА и у Нотебоок ЛМ. Бесплатни корисници ће моћи да испробају 3.1 Про у апликацији Гемини, али плаћени корисници на плановима Гоогле АИ Про и АИ Ултра ће имати веће стопе коришћења. У оквиру Нотебоок ЛМ-а, само ови плаћени корисници ће имати приступ 3.1 Про, барем за сада. Кодери и пословни корисници такође могу да приступе новом основном моделу преко програмера, а предузећа могу да приступе 3.1 преко АИ Студио, Антигравити, Вертек АИ, Гемини Ентерприсе, Гемини ЦЛИ и Андроид Студио.

Гемини 3.1 Про је већ био доступан за Масхабле уреднике који користе Гемини. Да бисте то сами испробали, идите на Близанци на десктопу или отворите мобилну апликацију Гемини.

снимак екрана који приказује анимацију из Гемини 3 про

лево:
Два резултата исте анимације.
Кредит: Гоогле

десно:
Кредит: Гоогле


Зашто је Гемини 3.1 Про битан

Када је Гоогле објавио Гемини 3 Про у новембру, модел је био толико импресиван да је наводно натерао извршног директора ОпенАИ Сема Алтмана да прогласи црвени код. Како је Гемини 3 Про скочио на врх АИ лидера, ОпенАИ је наводно почео да губи кориснике ЦхатГПТ-а због Геминија. Најновији основни ЦхатГПТ модел, ГПТ-5.2, пао је на ниже ранг листи ранг листе попут Арене (раније познат као ЛМАрена), изгубивши значајан положај у односу на конкуренте као што су Гоогле, Антхропиц и кАИ.

Гемини 3 Про је већ био бољи од ГПТ-5.2 у многим мерилима, а са напреднијим моделом размишљања, Гемини би могао да иде још даље.

Гемини 3.1 Про: Бенцхмарк перформансе

Гоогле је објавио бенцхмарк податке о перформансама који показују да Гемини 3.1 Про надмашује претходне моделе Гемини, Цлауде Соннет 4.6, Цлауде Опус 4.6 и ГПТ-5.2. Међутим, ОпенАИ-јев нови модел кодирања, ГПТ-5.3-Цодек, победио је Гемини 3.1 Про на верификованом СВЕ-Бенцх Про бенцхмарк-у, према самом Гуглу.

Значајни нагласци из референтних резултата Гемини 3.1 Про укључују:

  • 44,4 одсто на последњем испиту Хуманостиу поређењу са 40,0 процената за Цлауде Опус 4.6 и 34,5 процената за ГПТ-5.2

  • 77,1 одсто на АРЦ-АГИ-2у поређењу са 31,1 посто за Гемини 3 Про, 68,8 посто за Цлауде Опус 4.6 и 52,9 посто за ГПТ-5.2

  • 94,3 посто на ГПКА Диамонду поређењу са 91,9 посто за Гемини 3 Про, 91,3 посто за Цлауде Опус 4.6 и 92,4 посто за ГПТ-5.2

  • 80,6 процената на СВЕ-Бенцх Верифиеду поређењу са 76,2 посто за Гемини 3 Про, 80,8 посто за Цлауде Опус 4.6 и 80,0 посто за ГПТ-5.2

  • 54,2 одсто на СВЕ-Бенцх Про (јавно)у поређењу са 43,3 одсто за Гемини 3 Про, 55,6 одсто за ГПТ-5,2 и 56,8 одсто за ГПТ-5,3-Цодек

  • 92,6 одсто на ММЛУу поређењу са 91,1 посто за Цлауде Опус 4.6 и 89,6 посто за ГПТ-5.2

Гоогле је објавио слику која приказује потпуне бенцхмарк резултате за Гемини 3.1 Про:


Откривање: Зиф Дејвис, матична компанија Масхабле-а, је у априлу 2025. поднела тужбу против ОпенАИ-а, наводећи да је прекршила ауторска права Зифа Дејвиса у обуци и управљању његовим системима вештачке интелигенције.

извор линк

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button