Novac

Од сјајног објекта до трезвене стварности: прича о векторској бази података, две године касније

Када сам први пут написао Векторске базе података: Синдром сјајног објекта и случај несталог једнорога у марту 2024. индустрија је била преплављена хајком. Векторске базе података су позициониране као следећа велика ствар — инфраструктурни слој који се мора имати за ери АИ. Потекле су милијарде долара за улагања, програмери су пожурили да интегришу уградњу у своје канале, а аналитичари су без даха пратили рунде финансирања за Пинецоне, Веавиате, Цхрома, Милвус и десетак других.

Обећање је било опојно: коначно, начин да се претражује по значењу, а не по крхким кључним речима. Само баците своје пословно знање у векторску продавницу, повежите ЛЛМ и гледајте како се магија дешава.

Осим што се магија никада није у потпуности материјализовала.

Две године касније, провера стварности је стигао: 95% организација које су инвестирале у иницијативе ген АИ не виде нулте мерљиве приносе. И, многа упозорења која сам тада изнео – о ограничењима вектора, пренатрпаном окружењу добављача и ризицима третирања векторских база података као сребрних метака – одиграла су се скоро тачно онако како је предвиђено.

Предвиђање 1: Нестали једнорог

Тада сам се питао да ли ће Пинецоне – дете са постера категорије – постићи статус једнорога или ће постати „једнорог који недостаје“ у свету база података. Данас је на то питање одговорено на најречитији могући начин: Шишарка јесте наводно истражује продајукоји се бори да избије усред жестоке конкуренције и одлива купаца.

Да, Пинецоне је подигао велике кругове и потписао логотипе. Али у пракси, диференцијација је била танка. Играчи отвореног кода као што су Милвус, Кдрант и Цхрома снижавају их на цени. Актери као што је Постгрес (са пгВецтор) и Еластицсеарцх су једноставно додали векторску подршку као функцију. И купци су се све чешће питали: „Зашто уводити потпуно нову базу података када мој постојећи стек већ довољно добро ради векторе?“

Резултат: Пинецоне, некада вредан близу милијарду долара, сада тражи дом. Заиста нестали једнорог. У септембру 2025. Пинецоне је именовао Асх Асхутосх као извршни директор, а оснивач Едо Либерти прелази на улогу главног научника. Тајминг говори: До промене руководства долази усред све већег притиска и питања у вези са његовом дугорочном независношћу.

Предвиђање 2: Вектори сами по себи неће то прекинути

Такође сам тврдио да векторске базе података саме по себи нису крајње решење. Ако је ваш случај коришћења захтевао тачност — волим да тражим „Грешку 221“ у приручнику — чиста векторска претрага би радосно приказала „Грешку 222“ као „довољно близу“. Сладак у демо, катастрофалан у продукцији.

Та тензија између сличности и релевантности показала се фаталном за мит о векторским базама података као машинама за све намене.

„Предузећа су на тежи начин открила да је семантичка = исправна.“

Програмери који су радосно заменили лексичку претрагу вектора брзо су поново увели… лексичку претрагу у спрези са векторима. Тимови који су очекивали да ће вектори „само функционисати“ на крају су се одлучили за филтрирање метаподатака, реранкерс и ручно подешена правила. До 2025. консензус је јасан: вектори су моћни, али само као део хибридног стека.

Предвиђање 3: Препуно поље постаје комодизирано

Експлозија покретања векторских база података никада није била одржива. Веавиате, Милвус (преко Зиллиз), Цхрома, Веспа, Кдрант — сваки је тврдио суптилне диференцијације, али за већину купаца сви су радили исту ствар: складиште векторе и проналазе најближе суседе.

Данас, врло мали број ових играча избија. Тржиште се распарчало, комодизирало и на много начина је прогутано од стране постојећих компанија. Векторска претрага је сада функција поља за потврду на платформама података у облаку, а не самостални јарак.

Баш као што сам тада написао: Разликовање једног векторског ДБ-а од другог представљаће све већи изазов. Тај изазов је само постао тежи. Валд, Марко, ЛанцеДБ, ПостгресСКЛ, МиСКЛ ХеатВаве, Орацле 23ц, Азуре СКЛ, Касандра, Редис, Нео4ј, СинглеСторе, ЕластицСеарцх, ОпенСеарцх, Апахце Солр… листа се наставља.

Нова стварност: Хибрид и ГрапхРАГ

Али ово није само прича о паду – то је прича о еволуцији. Из пепела векторске хипе, појављују се нове парадигме које комбинују најбоље од више приступа.

Хибридна претрага: Кључна реч + вектор је сада подразумевана за озбиљне апликације. Компаније су научиле да су вам потребне и прецизност и нејасност, тачност и семантика. Алати као што су Апацхе Солр, Еластицсеарцх, пгВецтор и Пинецоне-ово сопствено „каскадно проналажење“ прихватају ово.

ГрапхРАГ: Најпопуларнија реч из касне 2024/2025. је ГрапхРАГ — проширена генерација преузимања побољшаног графом. Спајањем вектора са графовима знања, ГрапхРАГ кодира односе између ентитета које само уграђивање изравнава. Исплата је драматична.

Мерила и докази

  • Амазонов АИ блог наводи мерила из Леттриагде је хибридни ГрапхРАГ повећао тачност одговора са ~50% на 80% плус у скуповима тестних података у области финансија, здравства, индустрије и права.

  • Тхе ГрапхРАГ-клупа бенцхмарк (објављен у мају 2025.) пружа ригорозну процену ГрапхРАГ-а наспрам ванилла РАГ-а кроз задатке резоновања, упите са више скокова и изазове у домену.

  • Ан ОпенРевиев евалуација РАГ-а против ГрапхРАГ-а открили су да сваки приступ има предности у зависности од задатка — али хибридне комбинације често раде најбоље.

  • ФалкорДБ-ов блог извештава да када је прецизност шеме битна (структурирани домени), ГрапхРАГ може надмашити проналажење вектора за фактор од ~3,4к на одређеним мерилима.

Успон ГрапхРАГ-а наглашава ширу тачку: проналажење се не односи на било који један сјајни објекат. Ради се о изградњи системи за проналажење — слојевити, хибридни, контекстуално свесни цевоводи који дају ЛЛМ праве информације, са правом прецизношћу, у право време.

Шта ово значи напред

Пресуда је у: Векторске базе података никада нису биле чудо. Они су били корак — важан — у еволуцији тражења и проналажења. Али они нису, и никада нису били, завршница.

Победници у овом простору неће бити они који продају векторе као самосталну базу података. Они ће бити ти који ће уградити векторску претрагу у шире екосистеме — интегришући графиконе, метаподатке, правила и инжењеринг контекста у кохезивне платформе.

Другим речима: једнорог није векторска база података. Једнорог је гомила за преузимање.

Гледање унапред: Шта је следеће

  • Обједињене платформе података ће обухватити вектор + графикон: Очекујте да ће главни произвођачи базе података и облака понудити интегрисане стекове за преузимање (вектор + графикон + цео текст) као уграђене могућности.

  • „Инжењеринг повратка“ ће се појавити као посебна дисциплина: Као што је МЛОпс сазрео, тако ће и праксе око уграђивања подешавања, хибридног рангирања и конструкције графикона.

  • Мета-модели уче да боље питају: Будући ЛЛМ могу научити да оркестрира који метод преузимања користити по упиту, динамички прилагођавајући пондерисање.

  • Временски и мултимодални ГрапхРАГ: Истраживачи већ проширују ГрапхРАГ како би били свесни времена (Т-ГРАГ) и мултимодално уједињене (нпр. повезивање слика, текста, видеа).

  • Отворена мерила и слојеви апстракције: Алати попут БенцхмаркКЕД (за РАГ бенцхмаркинг) и ГрапхРАГ-Бенцх ће гурнути заједницу ка праведнијим, упоредивим системима.

Од сјајних објеката до основне инфраструктуре

Лук приче о векторској бази података прати класичан пут: свеприсутан циклус хиперактивности, праћен интроспекцијом, корекцијом и сазревањем. У 2025., векторско претраживање више није сјајни објекат за којим сви слепо трагају – то је сада критични грађевински блок унутар софистицираније, вишеструке архитектуре проналажења.

Првобитна упозорења су била тачна. Чисте наде засноване на векторима често се срушавају на плитке прецизности, релационе сложености и ограничења предузећа. Ипак, технологија никада није потрошена: натерала је индустрију да поново размисли о проналажењу, мешајући семантичке, лексичке и релационе стратегије.

Ако бих написао наставак 2027., претпостављам да би то уоквирило векторске базе података не као једнороге, већ као застарелу инфраструктуру — темељну, али затамњену паметнијим слојевима оркестрације, адаптивним контролерима преузимања и системима вештачке интелигенције који динамички бирају који алатка за проналажење одговара упиту.

За сада, права битка није вектор против кључне речи – то је индиректност, мешање и дисциплина у изградњи цевовода за проналажење који поуздано заснивају ген АИ у чињеницама и знању о домену. То је једнорог којег би сада требало да јуримо.

Амит Верма је шеф инжењеринга и лабораторија за вештачку интелигенцију Неурон7.

Прочитајте више од наших гостујући писци. Или размислите о томе да пошаљете своју објаву! Погледајте наше смернице овде.

Related Articles

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button