Како је АИ променио моју каријеру у биоинформатику


Успон агентичних АИ алата изазвао је Леи Зху да преиспита своју улогу у биоинформатици.КРЕДИТ: ЛЕИ ЗХУ
Када сам започео дипломски студиј, прво што сам требао да урадим је одабрао правац истраживања. Лабораторија коју сам придружио фокусираном на двије главне области: функционалне тестове и биоинформатике. Ово је било пре више од деценије, а типични ток радног тока је учествовао истраживачи биоинформација анализирајући велике скупове података да идентификују гене повезане са специфичним фенотиповима или болестима, које би затим предати функционално-тест тима за валидацију.
У то време био је биоинформација била ново, обећавајуће поље, па сам изабрао овај пут без оклевања. Али, нисам имао позадину програмирања, па је било тешко започети. Почео сам да студирам програмирање језика – први Перл, а затим Р и Питхон.
Гледајући уназад, задовољан сам по избором. Био је то узбудљиво време и брзи раст технологија високих протока и нових техника – као што су транскрипција и геномика, а касније и једно ћелијска биологија – дала ми је доста података са којима је послала. Решавање биолошких проблема кроз код који сам написао дао ми је осећај само-вредности.
Тада су се појавили алати вештачке интелигенције (АИ), укључујући ЦхатГГПТ, Манус и Грок. Њихова способност да испљуне функционални кодекс прети да ће ме ући ући, али нисам се у почетку не тиче, јер је АИ-генерисан кодекс често садржи грешке које се само појављују током тестирања и захтевају ручно уклањање погрешака. Нови „агентични“ начини рада, међутим, били су потенцијални измењивачи игре. Они омогућавају алате попут мануса да прво генерише код, а затим га покрећу директно у облаку, стварајући бешавну петљу: од мене постављајући питања, на писање алата и извршавајућим кодом, пријем. То је било кад сам почео да бринем: у овој старости АИ, да ли сам још увек потребан?
Данашњи АИ Алати могу ефикасно да пишу код за обављање биолошких анализа. Треба ми само пренос своје податке и пружити једноставан промпт, као што је: Претпоставимо да сте експерт за биоинформатику. Можете ли створити десет визуала да представљате различите податке на основу вашег разумевања горе наведеног података? Прикажите парцеле један по један, са кратким уводом. ‘ АИ пружа одговоре које су нам потребне, понекад прелазећи своја очекивања. Па, која је моја улога у овом процесу?
Сазнао сам током студије рака плућа. Имали смо стотине профила експресије гена туморског ткива и замолио сам АИ да постави анализу. Брзо је функционирало и чак је произвело уредни извештај. Прелиминарни резултати изгледали су сјајно – скоро превише добро. АИ је пре и после одређене временске тачке идентификовала статистички значајну разлику у нивоима гена експресије. Али док сам копала дубље, видео сам то, на пола пута кроз студију, лабораторија је променила како су прикупљени подаци. Модел је покупио ту разлику – ниједан због биологије. Оно што је изгледало као пробој је заправо само артефакт. Једном када сам се прилагодио за ту промену, разлика је постала мање драматична, али одражавала је стварна биологија.
Схватио сам да је моја улога прешла из скрипта на надзор. Оно што је сада важно представља јасно питање, примете проблеме које рачунар не може да види и преузима одговорност за одговор.
Горњи савети за АИ супервизоре
Људи ми кажу да бих могао да направим АИ паметније „постављањем више контекста у промпт“, али изгледа да мој АИ увек игра глупо. Без обзира колико детаљан мој захтев, он проналази начине да погрешно разумемо. У протеклих неколико година развио сам неке методе да двоструко проверим његов рад.
Креирајте сет за потврду. Држите мали податковни скуп који добро разумете – подскуп претходно објављених или ручно потврђених података, на пример – као позитивна контрола. Пре наношења новог АИ насталих цевовода у ваше податке, тестирајте га на овом сету. Ако АИ производи неочекиване или недоследне резултате, одмах ћете знати да је или упит или алгоритам потребан да се прецизира.
Померати податке. АИ модели могу лако да преносе податке или да буду смештени техничким артефактима, као што се догодило током студије на раку плућа. Да бисте тестирали да ли је налаз биолошки смислен, налепнице узорка, пертурб вредности незнатно или на други начин уносите синтетичку буку. Ако се „значајан“ образац траје, то је вероватно артефакт, а не истински сигнал.
Подмажите анализу. Ако је скуп података довољно велик, замолит ћу АИ да обавља исту анализу на насумичним подвигајима. Доследност у широм подтерија повећава самопоуздање: Ако резултати дивље разликују од једног под подсетком до друге, налаз се можда не може задржати.