Диснеи и ОпенАИ сигнализирају долазак АИ видео стримовања

Недавно сам погледао најранији сачувани филм, Роундхаи Гарден Сцене, који датира из 1888. Четири фигуре, два мушкарца и две жене, ходају по дворишту брзим, трзавим корацима. Траје око две секунде.
Недавно сам такође гледао неке клипове које су 2016. направили истраживачи са Технолошког института Масачусетса и Универзитета Мериленд који су међу првим видео снимцима који су у потпуности генерисани вештачком интелигенцијом. Сваки од њих траје око секунду. На једном, мутна фигура стоји на голф зеленилу, савијена у струку да удари. Нико не би збунио ове видео снимке или Роундхаи Гарден Сцене за углађени реализам савремене кинематографије. И баш као што скептици често исмевају АИ видео као расипнички, критичари из 19. века одбацили су рани биоскоп као „будаласту радозналост“.
Ипак, недавни споразум између Дизнија и ОпенАИ-а нуди увид у другачију будућност. Почевши од почетка 2026. године, видео генератор Сора технолошке компаније ће моћи да прави видео записе са више од 200 ликова из Дизнија, Марвела, Пиксара и Ратови звезда франшиза. А Диснеи+ ће емитовати избор клипова које је направио корисник.
О подршци научном новинарству
Ако уживате у овом чланку, размислите о томе да подржите наше награђивано новинарство претплата. Куповином претплате помажете да се обезбеди будућност упечатљивих прича о открићима и идејама које данас обликују наш свет.
Диснеи ће такође уложити милијарду долара у ОпенАИ и користити своје алате за изградњу „нова искуства за Диснеи+ претплатнике“, наводи се у заједничком саопштењу за штампу Дизнија и ОпенАИ. Најављујући партнерство, извршни директор Дизнија Роберт Игер рекао је да ће компанија „промишљено и одговорно проширити домет нашег приповедања кроз генеративну вештачку интелигенцију“. Такође је рекао у недавном конференцијском позиву о заради да намерава да претплатници креирају садржај унутар самог Диснеи+. Ако желите да гледате како Елса и Пепељуга скидају Малефисенту, моћи ћете да затражите сцену – иако може трајати само 20 секунди.
Ако је ово почетак АИ ТВ-а на захтев, питам се колико ће проћи док ови клипови не достигну 20 минута или сат, с обзиром на оптерећење животне средине и рачунарске трошкове. Доста људи верује да је то немогуће, али претпостављам да је мало оних који су гледали Роундхаи Гарден Сцене предвидео Велика пљачка воза, 12-минутна прекретница неме кинематографије из 1903. године, много мање Прохујало са вихором— или стриминг.
Изазов генерисања слике лежи у томе како функционишу данашњи системи. Изграђени су на дифузији, техници која почиње „шумом“ који се постепено прерађује у слику. Замислите слику особе која стоји у магли. АИ у суштини уклања маглу и ставља нове пикселе у поновљеним пролазима док се не појави кохерентна фигура. Сваки пролаз за прецизирање генерисане слике повећава цену.
Видео је још изазовнији. Серија слика мора бити усклађена како се црте лица не би промениле и шољице за кафу не би нестале. У једној секунди видеа високе дефиниције, милиони пиксела се мењају. Током главног говора на хакатону који је организовао центар АИ заједнице АГИ Хоусе, Билл Пееблес, истраживач ОпенАИ који је помогао у развоју Соре, рекао је: „Открили смо колико је болно радити са видео подацима. У овим видео снимцима има пуно пиксела.“
Да би управљао пикселима, систем ОпенАИ компресује видео у поједностављену верзију која чува кључне информације. Затим га третира као векну хлеба – реже га у оквире које затим дели на коцке. Ово омогућава моделу да координира све коцке једна са другом, баш као што модели који покрећу ЦхатГПТ повезују све речи у одговору.
Скок са секунди на минуте је тако кажњавајући јер што више оквира додате, више информација модел мора да има у виду. Како видео снимци постају дужи, недоследности се гомилају. Права АИ ТВ „на захтев“ такође би захтевала резове између сцена. Када би сваки Диснеи+ корисник то захтевао уз краткорочну технологију, трошкови би били запањујући.
Истраживачи су трагали за ефикаснијим приступима. Један је да модел разбије посао на фазе. „Уместо да умањујете шум или генеришете цео видео одједном, ви генеришете кадар по кадар“, каже Тианвеи Јин, научник истраживач у старт-упу Реве за уређивање АИ слика, који је ко-развио софтвер за генерисање видео записа ЦаусВид. „У сваком кораку, ваше израчунавање је ограничено на много мањи део уместо на пуну ствар, а то вам омогућава да радите много дуже.
Јин верује да ће системи ефикасније достићи пет минута генерације до следеће године и да би, кроз интеграцију различитих постојећих АИ технологија, могли да достигну сат времена након тога. Други су поновили овај оптимизам. У недавном интервјуу за Би-Би-Си, извршни директор Гоогле-а Сундар Пицхаи описао је могућност да средњошколци снимају дугометражне АИ филмове у наредним годинама. Кристобал Валенцуела, извршни директор компаније за генерисање АИ видео записа Рунваи, рекао је Ел Паис раније овог месеца, „Имати 60 или 90 минута са доследним ликовима и причом још увек није могуће. Али то ће бити ускоро.“ Даље је рекао да је на хоризонту и гледање АИ видео записа како се генеришу у реалном времену.
Пут од курираних клипова за обожаваоце до дугометражних филмова проћи ће кроз неке негламурозне иновације, а да не помињемо преговоре о томе како платити креативце чији рад га храни. И иако се финансијски терет АИ видео записа чини превисоким, милиони људи широм света укључени су у производњу и обуку АИ модела, а трошкови технологија се обично смањују. На пример, пропусни опсег је 1998. године био прескуп – коштао је око 1.200 долара по мегабиту у секунди (Мбпс) месечно за велике мреже – али до 2025. најнижи пријављени трошак био је 0,05 долара по Мбпс месечно, што је смањење од 99,996 процената. Ова промена је омогућила стриминг на Диснеи+ или Нетфлик-у.
Културни пут нових медија далеко је теже замислити, а отпор је често интензиван. Песник Шарл Бодлер осудио је фотографију 1859. због њеног лењог реализма који је уметност одвлачио из маште. У прошлим вековима, „скептици и партизани су поредили фотографију са сликарством, а покретне слике са позориштем“, написао је данашњи научник Рубен де Лотур. Чини се да смо у још компликованијем тренутку. Оно што се чини сигурним је да ће, као и у прошлости, технологија брзо еволуирати, омогућавајући милионима креатора да тестирају могућности које још не можемо да предвидимо.
Време је да се заузмемо за науку
Ако вам се допао овај чланак, замолио бих вас за подршку. Сциентифиц Америцан служио је као заговорник науке и индустрије 180 година, а управо сада је можда најкритичнији тренутак у тој двовековној историји.
Био сам а Сциентифиц Америцан претплатник од моје 12 година, и то је помогло у обликовању начина на који гледам на свет. СциАм увек ме образује и одушевљава, и изазива осећај страхопоштовања према нашем огромном, предивном универзуму. Надам се да ће то учинити и за вас.
Ако ти претплатите се на Сциентифиц Америцанпомажете да осигурамо да је наша покривеност усредсређена на смислена истраживања и открића; да имамо ресурсе да извештавамо о одлукама које прете лабораторијама широм САД; и да подржавамо и надобудне и запослене научнике у време када вредност саме науке пречесто остане непризната.
Заузврат, добијате важне вести, задивљујући подкасти, бриљантна инфографика, не могу пропустити билтене, видео снимке које морате погледати, изазовне игре и најбоље писање и извештавање у свету науке. Можете чак поклонити некоме претплату.
Никада није било важнијег тренутка да устанемо и покажемо зашто је наука важна. Надам се да ћете нас подржати у тој мисији.



