

Упркос све већем брбљању о будућности када је већи део људског рада аутоматизован од стране вештачке интелигенције, једна од иронија овог тренутног технолошког процвата је колико се тврдоглаво ослања на људска бића, посебно процес обуке АИ модела користећи учење појачања из људских повратних информација (РЛХФ).
Најједноставније речено, РЛХФ је систем подучавања: након што се АИ обучи на одабраним подацима, и даље прави грешке или звучи роботски. Лабораторије за вештачку интелигенцију затим масовно ангажују извођаче радова да оцењују и рангирају резултате новог модела док се он обучава, а модел учи из њихових оцена, прилагођавајући своје понашање да понуди резултате са вишим оценама. Овај процес је све важнији што се вештачка интелигенција шири да би произвела мултимедијалне излазе као што су видео, аудио и слике које могу имати нијансираније и субјективније мере квалитета.
Историјски гледано, овај процес подучавања је био огромна логистичка главобоља и ПР ноћна мора за АИ компаније, ослањајући се на фрагментиране мреже страних извођача и статичке групе за означавање у специфичним географским средиштима са ниским приходима, коју медији наводе као ниску плату — чак и експлоататорски. Такође је неефикасно: захтева од АИ лабораторија да чекају недељама или месецима на једну серију повратних информација, одлажући напредак модела.
Сада се појавио нови стартуп који би процес учинио далеко ефикаснијим: Рапидата‘с платформа ефективно "гамификује" РЛХФ прослеђујући наведене задатке прегледа широм света на скоро 20 милиона корисника популарних апликација, укључујући Дуолинго или Цанди Црусх, у облику кратких задатака прегледа који могу да изаберу да изврше уместо гледања мобилних огласа, са подацима који се тренутно шаљу назад у лабораторију за вештачку интелигенцију.
Као што је саопштено са ВентуреБеат-ом, ова платформа омогућава АИ лабораторијама "понављање модела у скоро реалном времену," значајно скраћивање временских рокова развоја у поређењу са традиционалним методама.
Извршни директор и оснивач Џејсон Коркил је навео у истом издању које издаје Рапидата "људско расуђивање доступно на глобалном нивоу и скоро у реалном времену, откључавајући будућност у којој тимови вештачке интелигенције могу да покрећу сталне повратне везе и граде системе који се развијају сваки дан уместо сваког циклуса издавања.""
Рапидата третира РЛХФ као инфраструктуру велике брзине, а не као проблем ручног рада. Данас нам је компанија ексклузивно најавила на ВентуреБеат-у своје појављивање са почетним кругом од 8,5 милиона долара који су заједно водили Цанаан Партнерс и ИА Вентурес, уз учешће Ацекуиа Цапитал и БлуеИард-а, како би проширили свој јединствени приступ људским подацима на захтев.
Кафански разговор који је створио људски облак
Генеза Рапидата није рођена у сали за састанке, већ за столом уз неколико пива. Када је Цоркилл био студент на ЕТХ у Цириху, радећи у роботици и компјутерском виду, када је ударио у зид са којим се сваки инжењер вештачке интелигенције на крају суочи: уско грло за бележење података.
"Конкретно, радим у роботици, вештачкој интелигенцији и компјутерском виду већ неколико година, студирао сам на ЕТХ овде у Цириху и увек сам био фрустриран бележењем података," Коркил се присетио у недавном интервјуу. "Увек када су вам били потребни људи или белешке о људским подацима, тада је ваш пројекат био заустављен, јер сте до тада могли да га померите напред само гурајући дуже ноћи. Али када вам је била потребна људска напомена великих размера, морали сте да одете код некога и онда сачекате неколико недеља".
Фрустрирани овим кашњењем, Цоркилл и његови суоснивачи су схватили да је постојећи модел рада за АИ у основи покварен за свет који се креће брзином модерног рачунарства. Док се израчунавање експоненцијално повећава, традиционална људска радна снага – везана ручним укључивањем, регионалним запошљавањем и спорим циклусима плаћања – није. Рапидата је настао из идеје да људска пресуда може бити испоручена као глобално дистрибуирана, скоро тренутна услуга.
Технологија: претварање дигиталних отисака у податке за обуку
Основна иновација Рапидата лежи у његовом начину дистрибуције. Уместо да ангажује анотаторе са пуним радним временом у одређеним регионима, Рапидата користи постојећу економију пажње у свету мобилних апликација. Удруживањем са апликацијама независних произвођача као што су Цанди Црусх или Дуолинго, Рапидата нуди корисницима избор: да гледају традиционални оглас или проведу неколико секунди дајући повратне информације за АИ модел.
"Корисници се питају: ‘Хеј, да ли бисте радије уместо да гледате рекламе и да вам, знате, компаније тако купују очи, да ли бисте радије коментарисали неке податке, дали повратне информације?’" Цоркилл је објаснио. Према Цоркилл-у, између 50% и 60% корисника се одлучује за задатак повратне информације у односу на традиционалну видео рекламу.
Ово "интелигенција гомиле" приступ омогућава тимовима вештачке интелигенције да се укључе у разнолику, глобалну демографску групу на невиђеном нивоу.
-
Глобална мрежа: Рапидата тренутно достиже између 15 и 20 милиона људи.
-
Велики паралелизам: Платформа може да обради 1,5 милиона људских напомена у једном сату.
-
брзина: Циклуси повратних информација који су раније трајали недељама или месецима сведени су на сате или чак минуте.
-
Контрола квалитета: Платформа гради поверење и профиле стручности за испитанике током времена, обезбеђујући да се сложена питања упореде са најрелевантнијим људским судијама.
-
Анонимност: Док се корисници прате путем анонимних ИД-ова како би се осигурала доследност и поузданост, Рапидата не прикупља личне идентитете, одржавајући приватност и оптимизујући за квалитет података.
Онлине РЛХФ: Прелазак у ГПУ
Најзначајнији технолошки скок који Рапидата омогућава је оно што Цоркилл описује "онлине РЛХФ". Традиционално, АИ се обучава у одвојеним групама: обучавате модел, заустављате се, шаљете податке људима, чекате недељама на етикете, а затим настављате. Ово ствара а "круг" информација којима често недостаје свеж људски допринос.
Рапидата премешта ову пресуду директно у циклус обуке. Пошто је њихова мрежа тако брза, могу се интегрисати преко АПИ-ја директно са ГПУ-овима који покрећу модел.
"Увек смо имали идеју о учењу са појачањем за људске повратне информације… до сада сте то увек морали да радите као у групама," рекао је Цоркилл. "Сада, ако идете скроз доле, сада имамо неколико клијената где, пошто смо тако брзи, можемо бити директно, у суштини у процесу, као у процесору на десној страни ГПУ-а, а ГПУ израчунава неки излаз, и може одмах да захтева од нас на дистрибуиран начин. „Ох, треба ми, треба ми, треба ми човек да погледам ово.“ Добијем одговор и онда применим тај губитак, што до сада није било могуће".
Тренутно, платформа подржава отприлике 5.500 људи у минути пружајући повратне информације уживо моделима који раде на хиљадама ГПУ-а. Ово спречава "хаковање модела награђивања," где два АИ модела варају један другог у повратној спрези, тако што обуку заснивају на стварним људским нијансама.
Производ: Решавање за укус и глобални контекст
Како АИ превазилази једноставно препознавање објеката у генеративне медије, захтеви за означавање података су еволуирали од објективног означавања до субјективног "на основу укуса" кустос. Не ради се више само о томе "да ли је ово мачка?" него радије "да ли је ова синтеза гласа убедљива?" или "који од ова два сажетка се чини професионалнијим?".
Лили Клифорд, извршна директорка покретача гласовне вештачке интелигенције Риме, напомиње да је Рапидата била трансформативна за тестирање модела у стварном свету. "Раније је прикупљање значајних повратних информација значило спајање добављача и анкета, сегмент по сегмент, или земљу по земљу, што није било у скали," Цлиффорд је рекао. Користећи Рапидата, Риме може да досегне праву публику — било у Шведској, Србији или Сједињеним Државама — и да види како модели раде у стварним радним токовима клијената у данима, а не месецима.
"Већина модела је у ствари тачна, али сигуран сам да сте добили е-поруке које изгледају, знате, не аутентичне, зар не?" Цоркилл је приметио. "Можете да осетите мирис АИ е-поште, можете да осетите АИ слику или видео, одмах вам је јасно… ови модели се још увек не осећају као људи, а потребна вам је људска повратна информација да бисте то урадили".
Економска и оперативна промена
Са оперативне тачке гледишта, Рапидата се позиционира као инфраструктурни слој који елиминише потребу да компаније управљају сопственим прилагођеним операцијама бележења. Пружајући скалабилну мрежу, компанија смањује баријеру уласку за тимове АИ који су се раније борили са трошковима и сложеношћу традиционалних петљи повратних информација.
Јаред Невман из компаније Цанаан Партнерс, који је водио инвестицију, сугерише да је ова инфраструктура од суштинског значаја за следећу генерацију вештачке интелигенције. "Свако озбиљно увођење вештачке интелигенције зависи од људске процене негде у животном циклусу," рекао је Њуман. "Како модели прелазе са задатака заснованих на стручности на курирање засновано на укусу, потражња за скалабилним људским повратним информацијама ће драматично расти".
Будућност људске употребе
Док је тренутни фокус на моделним лабораторијама у области залива, Цоркилл види будућност у којој сами модели вештачке интелигенције постају примарни купци људског расуђивања. Он то зове "људска употреба".
У овој визији, АИ дизајнера аутомобила не би само створио генеричко возило; могао би програмски да позове Рапидата да пита 25.000 људи на француском тржишту шта мисле о одређеној естетици, понови ту повратну информацију и усаврши њен дизајн у року од неколико сати.
"Друштво је у сталном току," Коркил је приметио, бавећи се трендом коришћења вештачке интелигенције за симулацију људског понашања. "Ако сада симулирају друштво, симулација ће бити стабилна и можда пресликати наше неколико месеци, али онда се потпуно мења, јер се друштво променило и развило потпуно другачије".
Стварањем дистрибуираног, програмског начина за приступ капацитетима људског мозга широм света, Рапидата се позиционира као витална међусобна веза између силицијума и друштва. Са новим финансирањем од 8,5 милиона долара, компанија планира да се креће агресивно како би осигурала да како се АИ повећава, људски елемент више не буде уско грло, већ функција у реалном времену.


