kultura

Нови ДНК претраживач доноси налог на Биологиове велике податке

Нови ДНК претраживач доноси налог на Биологиове велике податке

Испуни пресликавање огромних архива података у претраживач за научнике, отварање нових граница биолошког открића

Приказ за ДНК хелике окружен сјајним тачкицама.

Интернет има Гоогле. Сада је биологија има престану. Детаљан данас у Природапретраживач може брзо проћи кроз запањујуће количине биолошких података смештених у јавним спремиштима.

„То је огромно достигнуће“, каже Раиан Цхикхи, истраживач биокомпута на Пастеур Институту у Паризу. „Они постављају нови стандард“ за анализу сировских биолошких података – укључујући ДНК, РНА и протеин секвенце – из база података које могу садржати милион милијарди и писаћих слова у износу од „петабаза“ информација, више уноса од свих веб страница у Гоогле-овој веб страници у Гоогле-овом веб страницу.

Иако је пребацивање метара означено као „Гоогле за ДНК“, Цхикхи се личи алат за претраживач за ИоуТубе, јер су задаци рачунарски захтевни. На исти начин на који ИоуТубе претражује сваки видео снимак који функционише, рецимо, црвене балоне чак и када се оне кључне речи не појаве у наслову, ознакама или опису, могу да открију генетски обрасце скривене дубоко у ексансивним секторима података без потребе да се они обрасци треба унапред означити.


О подржавању научног новинарства

Ако уживате у овом чланку, размислите о подршци нашем награђиваном новинарству Претплата. Куповином претплате помажете да се осигура будућност утицајних прича о открићима и идејама које данас у облику света у облику света.


„Омогућује ствари које се не могу учинити ни на који други начин“, каже Цхикхи.

Индексирање животне библиотеке

Мотивација која стоји иза метара била је да се реши проблем приступачности у секвенцирању скупова података. Величина ових складишта порасла је на блистеринг темпо у последњих неколико деценија, али овај раст је представио изазове научницима који користе податке које садрже. Реаксна секвенцизација је фрагментирана, бучна и превише бројна која ће директно претражити. „Обим података, парадоксално је да је главни инхибитор нас заправо користили податке“, каже Артем Бабаиан, рачунарски биолог на Универзитету у Торонту у Канади.

Према речима једног од аутора студије, Андре Кахлес, биоинформатијанског у Швајцарском федералном институту за технологију (ЕТХ), у Швајцарској би могло помоћи истраживачима да постављају биолошка питања спремишта, као што су архива за читање секвенце (СРА), јавна база података која садржи више од 100 милиона милијарди ДНК писма.

Они су се решили са проблемом употребом математичких ‘графичких’ графикона који су повезани преклапајући ДНК фрагмента заједно, слично као што су реченице које деле исте речи које се баве у књизи.

Истраживачи су интегрисани подаци из седам јавно финансираних складишта података, стварајући 18,8 милиона јединствених сетова ДНК и РНА секвенце и 210 милијарди секвенце аминокиселих сета у свим прикупљањима живота – укључујући вирусе, бактерије, гљивице, биљке и животиње, укључујући људе, бактерије, гљивице, биљке и животиње. Такође су развили претраживач за ове секвенце, у којима корисници користе текстуалне упутства за претрагу ових интегрисаних архива сирових података.

„То је потпуно нов начин да комуницирамо са овим тијелом података“, каже Кахлес. „Компримирана је, али доступна у муху.“

Да бисте демонстрирали корисност пута, студијски аутори који су га користили за скенирање 241,384 узорака хуманог црева за генетски индикатори антибиотске отпорности широм света, зграда на раду који је користио ранију верзију алата за праћење гена отпорности на дрогу у бактеријским системима у бакционим системима у бакционим системима у бакционим системима. Аутори кажу да су анализирали за око сат времена на врхунским путем.

Отворени пут до открића

Искључено је да није једини алат за претраживање секвенци масивног секвенци.

Цхикхи и Бабаиан, на пример, изградили су платформу звану Логан, који убоде заједно милијарде кратког секвенцирања чита да би се дуже поставело, организовано дионице ДНК. Ова дизајнерска архитектура омогућава да се систем уочи читавих гена и њихове варијанте у још већим збиркама редоследа поступања него што је могуће саставно саставно, иако са одређеним компромисима. „Имамо мање функционалност, али више перформанси“, каже Цхикхи.

Додатни домет Логана помогао је истраживачима да открију више од 200 милиона природних урођених ензима који је на пластику пронађен у разним бактеријама, гљивицама и инсектима – укључујући неке верзије које раде још боље од ензима дизајнираних у лабораторији. Цхикхи и Бабаиан пријавили су своје налазе у преприштини који је објављен прошлог месеца.

Они су и други такође користили раније, уже алате за претраживање прилагођених вирусним ДНК-у да би открили прорез претходно недокументираних вируса и вирусних контаминаната у пројектованим Т-ћелијским терапијама за лечење рака.

Према Бабаиан-у, такве откриће не би биле могуће без две ствари: алати за претрагу отвореног кода, доступни на сајтовима као што су метхап4.етхз.цх и логан-сеарцх.орг и јавно секвенцирање у додиривању у додиривању у додиривању. Са смањењем финансирања прети другим врстама биолошких база података, бабајски наглашава да ове претраге иновације подвлаче „критичну важност отворених дељења података“.

„Ово су ресурси за вођење научног напретка широм света“, каже Бабаиан. „Они отварају потпуно ново поље геномике у петабази“ – и још увек нецентније апликације тек долазе.

Овај чланак се репродукује уз дозволу и био је прво објављено 8. октобра 2025.

Време је да устанете за науку

Ако сте уживали у овом чланку, хтео бих да вас затражим за вашу подршку. Научни амерички Служио је као заговорник за науку и индустрију 180 година, а тренутно је можда најкритичнији тренутак у историји двоструке века.

Био сам Научни амерички Претплатник од мене је било 12 година, а помогло је да се обликова на начин на који гледам на свет. Сциам Увек ме едукује и одушевљава ме и надахњује осећај страхопоштовања за наш огроман, леп универзум. Надам се да и за вас то и за вас.

Ако ти претплатити се на Научни америчкипомажете да осигурате да је наша покривеност усредсређена на смислено истраживање и откриће; да имамо ресурсе за извештавање о одлукама које прете лабораторију широм САД-а; И да подржавамо и пупољке и радне научнике у то време када се вредност саме науке пречета пречета непризната.

Заузврат добијате основне вести, Очаравање подцаста, сјајна инфографије, Не могу да пропусте вилатери, сигурносним видео снимцима, Изазовне игре и најбоље писање и извештавање науке на свету. Чак можете поклоните некога претплату.

Никада није било важније време да се застанемо и покажемо зашто је научна питања. Надам се да ћете нас подржати у тој мисији.

Related Articles

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button