Тајне кинеског АИ модела Деепсеек откривени су у оријентирском папучу

0 0 4 minutes read

17. септембра 2025

4 мин прочитано

Тајне ДЕЕПСЕЕК АИ модела откривене у оријентирском папира

Прва рецензирана студија Деепсеек АИ модела показује како је кинеска старт-уп фирма натјецала на тржиште за 300.000 долара

Аутор: Елизабетх Гибнеи & Натуре Магазине

Особа која користи Деепсеек Апп на паметном телефону — Деепсеек каже да је њен Р1 модел није научио копирање примјера који су створили други ЛЛМС.

Иаин Мастертон / Алами Ливе Невс

Успех ДЕЕПСЕЕК-ове моћне вештачке интелигенције (АИ) Р1 – који је у јануару учинило да је у јануару пуштен у јануару – није зглобовао да су обучени о производњи њених ривала, рекли су истраживачи кинеске фирме. Изјава је стигла у докумената пуштена заједно са вршњачком верзијом Р1 модела, објављене данас у Природа.

Р1 је осмишљен да се преврне на „расуђивање“ задацима као што су математика и кодирање и јефтиније је ривал на алате које су развили америчке технолошке фирме. Као модел „отворене тежине“, доступан је свима који ће преузети и најпопуларнији је такав модел на АИ заједничкој платформи загрљају лице које је загрлио лице, преузето је 10,9 милиона пута.

Ажурира да је папир прецизан прецизан у јануару, који описује како је дубоко повећао стандардни велики језик (ЛЛМ) да би се позабавио резоновањем задатака. Њени додатни материјал се први пут открива колико Р1 трошак тренира: еквивалент од само 294.000 УСД. То долази на врху од 6 милиона долара или да је компанија, са седиштем у Хангзхоу, потрошила да је база ллм да је Р1 уграђена, али укупни износ је и даље знатно мањи од десетина милион долара које су супарници за супарнике, сматрали да су ривалски модели. Деепсеек каже да је Р1 углавном обучен на НВИДИЈ-ове Х800 чипове, који је 2023. постало забрањено да се продаје у Кини у оквиру америчких контрола извоза.

О подржавању научног новинарства

Ако уживате у овом чланку, размислите о подршци нашем награђиваном новинарству Претплата. Куповином претплате помажете да се осигура будућност утицајних прича о открићима и идејама које данас у облику света у облику света.

Ригорозна рецензија

Сматра се да је Р1 први главни ЛЛМ који је прошао процес рецензије. „Ово је врло добродошли преседан“, каже Левис Тунсталл, инжењер машине у учењу у загрлицу лица која је прегледала Природа папир. „Ако немамо ову норму јавно дељење великог дела овог процеса, постаје веома тешко проценити да ли ови системи представљају ризике или не.“

Као одговор на коментаре на рецензију, тима Деепсеек је смањио антропоморфилисање у својим описима и додао појашњења техничких детаља, укључујући врсте података које је модел обучен и његова сигурност. „Пролазак кроз ригорозни процес рецензије сигурно помаже у верификацији валидности и корисности модела“, каже Хуан Сун, АИ истраживач у Државном универзитету у Охио у Колумбу. „Остале фирме би требало да ураде исто.“

Главна иновација Деепсеекова била је да се користи аутоматизована врста приступа пробне и грешке познатом као чисто појачање учење за креирање Р1. Процес је награђен модел за постизање тачних одговора, а не да га настави да следи примјере изабраних човека. Компанија каже да је то начин на који је његов модел научио сопствене стратегије попут резоновања, као што је како да верификују своје радно време без пратећих тактика прописане људске. Да би се повећала ефикасност, модел је такође постигао своје покушаје коришћења процене, а не да се користи засебног алгоритма да то учини, технику познату као групна релативна оптимизација политике групе.

Модел је „прилично утицајан“ међу АИ истраживачима, каже Сун. „Скоро сви раде у 2025. до сада, то проводи учење ојачања у ЛЛМ-у можда је на један или други начин инспирисан Р1.“

Техника за обуку

Извештаји о медијима у јануару су предложили да истраживачи на ОпенАИ-у, компанији, са седиштем у Сан Франциску, Калифорнији, који су створили ЦхатГгпт и „О“ серију резоновских модела, мислили су да су Деепсеек користили излазе из ОпенАИ модела да би обучили Р1, методу који би могао да убрза способност модела.

Деепсеек није објавио своје податке о обуци као део рада. Али, у размјенама судија, истраживачи фирме су изјавили да Р1 није научио копирањем резоновања примјера који су генерисали моделе ОпенАИ-а. Међутим, они су признали да је, као и већина осталих ЛЛМ-а, основни модел Р1 обучен на Интернету, тако да ће уносити било који АИ генерацијски садржај већ на Интернету.

Овај побијање је „као убедљив као што смо могли да видимо у било којој публикацији“, каже Сун. Tunstall adds that although he can’t be 100% sure R1 wasn’t trained on OpenAI examples, replication attempts by other labs suggest that DeepSeek’s recipe for reasoning is probably good enough to not need to do this. „Мислим да су докази сада прилично јасни да можете добити веома високе перформансе само користећи чисто средство за ојачање“, каже он.

За истраживаче, Р1 је и даље веома конкурентно, каже Сун. У изазову за испуњавање научних задатака као што су анализа и визуелни подаци, познати су и науциАгентбенцх, сунце и колеге су открили да иако Р1 није био први за тачност, то је био један од најбољих модела у погледу способности балансирања.

Други истраживачи сада покушавају да примене методе које се користе за креирање Р1 да би се побољшало резоновање способности постојећих ЛЛМ-а, као и да их продужете до домене изван математике и кодирања, каже Тунсталл. На тај начин додаје, Р1 је „почео да је покренуо револуцију“.

Овај чланак се репродукује уз дозволу и био је прво објављено 17. септембра 2025.

Време је да устанете за науку

Ако сте уживали у овом чланку, хтео бих да вас затражим за вашу подршку. Научни амерички Служио је као заговорник за науку и индустрију 180 година, а тренутно је можда најкритичнији тренутак у историји двоструке века.

Био сам Научни амерички Претплатник од мене је било 12 година, а помогло је да се обликова на начин на који гледам на свет. Сциам Увек ме едукује и одушевљава ме и надахњује осећај страхопоштовања за наш огроман, леп универзум. Надам се да и за вас то и за вас.

Ако ти претплатити се на Научни америчкипомажете да осигурате да је наша покривеност усредсређена на смислено истраживање и откриће; да имамо ресурсе за извештавање о одлукама које прете лабораторију широм САД-а; И да подржавамо и пупољке и радне научнике у то време када се вредност саме науке пречета пречета непризната.

Заузврат добијате основне вести, Очаравање подцаста, сјајна инфографије, Не могу да пропусте вилатери, сигурносним видео снимцима, Изазовне игре и најбоље писање и извештавање науке на свету. Чак можете поклоните некога претплату.

Никада није било важније време да се застанемо и покажемо зашто је научна питања. Надам се да ћете нас подржати у тој мисији.