kultura

Синтетички подаци могу имати користи од медицинских истраживања – али ризици морају бити препознати

Имате потпуни приступ овом чланку преко своје институције.

Радиолог у Схаокинг Централној болници врши брзе и тачне дијагнозе уз помоћ АИ система за анализу слике

Синтетички подаци имају потенцијал да побољшају аспекте здравствене заштите, на пример, у брзу анализу рендгенских зрака.Кредит: Цостфото / Нурпхото / Гетти

Револуција обећана примјеном вештачке интелигенције (АИ) у истраживање и здравствену заштиту много се расправља, али мање пажње је уплаћено под-револуцији која је следеће у свом клизишту. Све више се, АИ модели обучавају на „синтетичким“ подацима. Не постоји универзално договорена дефиниција за ову врсту података, али у овом уреднику говоримо о информацијама које се користе у медицинским истраживањима која нису прикупљена у стварном свету. Постоје све већи број скупова синтетичких података који су генерисали математички модел или алгоритам – понекад укључују податке о стварном свету – и дизајнирани су тако да опонашају претпостављену статистичку својства података о статистичким Статистима.

Употреба таквих података има неке јасне користи, на пример, за генерацију хипотезе, за прелиминарно тестирање идеје пре стварне прикупљање података и за предвиђање резултата експеримената. Синтетички подаци такође имају много потенцијала да побољшају студије које укључују земље са ниским и средњим приходима, где стварни подаци могу бити оскудни, а баријере за прикупљање високих. Синтетички подаци се такође могу делити слободније, делом јер постоји мање ризика учесника студија који се идентификују, кажу проговори1.

Као један пример њихове примене у клиничким подешавањима, синтетички подаци се користе у АИ моделима који могу протумачити Кс-Раи скенирање пацијената и генерирати референтне скенирање2. Широм света постоји недостатак радиолога, а реалне податке о тренингу остају ограничени. АИ модели могу помоћи радиолозима у доношењу одлука, потенцијално помажући да раде брже и са већом тачношћу3.

Као што извештавамо ове недеље (Природа хттпс: //дои.орг/10.1038/Д41586-025-02911-1; 2025.), Неки универзитети и истраживачке институције одричу се захтеве етичких прегледа за истраживање у којима се користе синтетичке податке уместо људских података. Обично би одбор независног етике размотрио како студије утичу на права, сигурност, достојанство учесника и благостање. Али зато што су синтетички подаци најизражавани од људских података, неки истраживачи су успели да убеде своје институције да етички преглед није потребан. С обзиром на брзину и скали на којој се АИ усваја, то подиже најмање две бриге.

Прво је како боље разумети и ублажити ризик да се људи користе за генерисање АИ модела. Овај конкретни проблем могао би се умањити како се модели крећу кроз њихов други, трећи, четврти и пети итерације – у којима су синтетички подаци у основи обучени на другим синтетичким подацима, а веза до стварних података постаје удаљенија веза. Али потребно је схватити озбиљно ако се, на пример, идентитети могу открити без пристанка појединаца4.

Друга забринутост је дубље укоријењена. Свако ко са кожом у овој игри – као што је произвођачи, издавачи и корисници АИ студија – морају се уверити да се налазе АИ модела обучени на синтетичким подацима могу потврдити, не најмање због ризика од ризика од ризика од ризика од ризика од ризика од ризика од ризика од ризика од „модела колапса“. У овом сценарију, АИ модели обучени о узастопним генерацијама синтетичких података почињу да генеришу глупости5. Валидација може да поднесе различите облике, али у свом језгру је принцип да резултати треба да потврде истраживачи независни од оних који је то пријављују. Тренутно се то често не догађа и не постоје договорене смернице за то како би то требало. Међутим, истраживачи предлажу начине на који се може подржати.

Зисис Козлакидис, научник података о Светској здравственој организацији, са седиштем у Женеви, Швајцарска, каже да би, у недостатку стварних података о тестирању резултата резултата на тестирањем резултата из Синтетичких података, истраживачи би требало да објасне како су стварали њихове синтетичке податке, описујући њихов алгоритам, параметре и претпоставке. Они би такође могли да предложи како друга група може да потврди своје резултате.

У члану објављен у Медицина заснована на доказима БМЈ У јулу, биоинформатика истраживач Ранди Фокер на Универзитету Миссоури у Колумбији и њене колеге сугерирају да би требало да буду стандарди за извештавање о синтетичким подацима, заједно са онима који већ постоје за доступност података и шифре6. Они препоручују да истраживачи раде са издавачима да их развију.

Марцел Бинз на Хелмхолтз институту за људско лице у Минхену, Немачка, чини снажан случај валидације у свим облицима АИ (Природа хттпс: //дои.орг/Г9Р6ЦТ; 2025.), након студије, на којем је коаутор, како се АИ користи за предвиђање доношења одлука људи7. Модел који је он и његове колеге развили, звали Центаур, обучени су о подацима из експеримената психологије који су забиљежили више од 10 милиона избора учесника студија у различитим задацима доношења одлука. Неки истраживачи су скептични због њене способности да предвиђа људско понашање. Бинз је рекао ПриродаНовости вести који модел – који је слободно доступан – потребно је да се спољно потврди. „То је вероватно најгора верзија Центаура коју ћемо икада имати и она ће бити само боље одавде.“

Предности синтетичких података су јасне. Али ризици морају бити препознати и ублажени – и искушење да прихвате резултате важећи и тачни само зато што рачунар каже да се морају избегавати по свим трошковима.

Related Articles

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button