
Људски језик је изузетно богат и замршен. Ипак, са становишта теорије информација, исте идеје би се теоретски могле пренети у далеко компримованијем формату. То поставља интригантно питање: зашто људи не комуницирају у дигиталном систему јединица и нула као што то раде рачунари?
Мајкл Хан, лингвиста из Сарбрикена, покушао је да одговори на то питање са Ричардом Футрелом са Калифорнијског универзитета у Ирвајну. Заједно су направили модел који објашњава зашто људски језик изгледа онако како изгледа. Њихово истраживање је недавно објављено у Природа, људско понашање.
Људски језик и ефикасност информација
Око 7.000 језика се говори широм света. Неке користи само неколико преосталих говорника, док друге као што су кинески, енглески, шпански и хинди говоре милијарде. Упркос разликама, сви језици служе истој суштинској сврси. Они саопштавају значење комбиновањем речи у фразе, које се затим слажу у реченице. Сваки део носи своје значење, а заједно стварају јасну поруку.
„Ово је заправо веома сложена структура. Пошто природни свет тежи максималној ефикасности и очувању ресурса, сасвим је разумно запитати се зашто мозак кодира лингвистичке информације на тако наизглед компликован начин уместо дигитално, као компјутер“, објашњава Мајкл Хан. У теорији, кодирање говора као бинарног низа јединица и нула било би ефикасније јер компресује информације чвршће од говорног језика. Па зашто људи не комуницирају као Р2-Д2 из Ратова звезда? Хан и Футрелл верују да су пронашли одговор.
Језик је изграђен око искуства из стварног света
„Људски језик је обликован реалношћу живота око нас“, каже Мајкл Хан. „Када бих, на пример, говорио о пола мачке у пару са пола псом и то сам поменуо користећи апстрактни израз „гол“, нико не би знао на шта сам мислио, јер је прилично извесно да нико није видео гол – то једноставно не одражава ничије проживљено искуство. Једнако тако, нема смисла мешати речи „мачка“ у слово које користи исто слово, али немогуће је протумачити“, наставља он.
Кодирани облик као што је „гадцот“ технички садржи слова из обе речи, али је за слушаоце бесмислен. Насупрот томе, фраза „мачка и пас“ је одмах разумљива јер су обе животиње познати концепти. Људски језик функционише јер се директно повезује са заједничким знањем и проживљеним искуством.
Мозак преферира познате обрасце
Хан сумира налазе на следећи начин: „Једноставно речено, нашем мозгу је лакше да крене оним што се чини компликованијим путем. Иако природни језик није максимално компримован, много мање оптерећује мозак. То је зато што мозак обрађује речи у сталној интеракцији са оним што већ знамо о свету.
Чисто дигитални код могао би брже преносити информације, али би био одвојен од свакодневног искуства. Хан ово пореди са путовањем на посао: „На нашем уобичајеном путу на посао, рута нам је толико позната да је вожња скоро као на аутопилоту. Наш мозак тачно зна шта може да очекује, тако да је напор који треба да уложи много мањи. Кретање краћом, али мање познатом рутом је много заморније, јер нова рута захтева да будемо много пажљивији током вожње. Из математичке перспективе, он додаје: „Број битова које мозак треба да обради је далеко мањи када говоримо на познате, природне начине.“
Другим речима, говор и разумевање бинарног кода захтевало би много више менталног напора и од говорника и од слушаоца. Уместо тога, мозак стално процењује колика је вероватноћа да ће се следеће речи и фразе појавити. Пошто свакодневно користимо свој матерњи језик током деценија, ови обрасци постају дубоко усађени, чинећи комуникацију глаткијом и мање захтевном.
Како предиктивна обрада обликује говор
Хан нуди јасну илустрацију: „Када изговорим немачку фразу ‘Дие фунф грунен Аутос’ (енглески: ‘пет зелених аутомобила’), та фраза ће готово сигурно имати смисла неком другом говорнику немачког, док ‘Грунен фунф дие Аутос’ (енглески: ‘зелено пет аутомобила’, он каже да неће).
Када неко чује „Дие фунф грунен Аутос“, мозак одмах почиње да тумачи значење. Реч „Умри“ сигнализира одређене граматичке могућности. Немачки слушалац може одмах да сузи опције, искључујући именице мушког или средњег рода једнине. Следећа реч, „фунф“, сугерише нешто пребројиво, искључујући апстрактне идеје као што су љубав или жеђ. Тада „грунен“ означава да ће именица бити у множини и зелене боје. У том тренутку предмет би могли бити аутомобили, банане или жабе. Тек када се изговори последња реч, „аутомобили“, значење се у потпуности поставља на своје место. Са сваком речју, мозак смањује неизвесност док не остане само једно тумачење.
Насупрот томе, „Грунен фунф дие Аутос“ нарушава овај предвидљиви образац. Очекивани граматички сигнали се појављују погрешним редоследом, тако да мозак не може лако да изгради значење из секвенце.
Импликације за АИ и језичке моделе
Хан и Футрелл су били у стању да математички демонстрирају ове обрасце. Њихови налази, објављени у Природа, људско понашањепоказују да људски језик даје приоритет смањењу когнитивног оптерећења у односу на максимализацију компресије.
Ови увиди такође могу да допринесу побољшањима у великим језичким моделима (ЛЛМ), системима који стоје иза генеративних алата АИ као што су ЦхатГПТ или Мицрософтов Цопилот. Боље разумевање како људски мозак обрађује језик, истраживачи би могли да дизајнирају системе вештачке интелигенције који су ближе природним комуникацијским обрасцима.


