Неуронска мрежа обучена да класификује грешке кристалне структуре у МОФ и другим базама података | Истраживања

Неуронска мрежа обећава да ће побољшати верност база података кристалне структуре за метал-органске оквире (МОФ) откривањем и класификацијом структурних грешака.1 Приступ, који означава уносе са изостављањем протона, неравнотежом наелектрисања и кристалографским поремећајем, могао би да помогне у повећању тачности рачунских предвиђања која се користе у откривању материјала који се ослањају на такве базе података.
Вештачка интелигенција и машинско учење постају све важнији у истраживању материјала, а научници се често окрећу таквим алатима да предвиде својства нових једињења. Међутим, расте забринутост око поузданости основних скупова података; базе података великих кристалних структура често садрже грешке које могу угрозити низводне симулације и предвиђања.
Марко Гибалди, студент докторских студија у групи Том Воо-а на Универзитету Отава у Канади, искусио је овај проблем из прве руке са Министарством финансија које је рангирано као најбољи по питању софтвера за предвиђање. „Када је неко покушавао да то упореди са експерименталним својствима, симулирана својства и експеримент нису били ништа слични, а ми смо покушавали да схватимо у чему је проблем“, каже Гибалди. Они су пратили неслагање до симулиране кристалне структуре, која је садржала грешке у својој структури и није одражавала реалистичан хемијски материјал.
Гибалди и његове колеге су од тада анализирали неколико МОФ база података отвореног приступа које се обично користе за машинско учење и открили да више од 40% кристалних структура у базама података садржи грешке.2
Сада су Гибалди, Воо и колеге развили метод за откривање дефеката у кристалним структурама унутар база података и класификовали их према њиховом типу грешке. Почели су састављањем скупа података од 11.000 МОФ-ова, што је захтевало ручну проверу сваке структуре и грешке у обележавању по типу, фокусирајући се на изостављање протона, неравнотежу наелектрисања и кристалографски поремећај. „Чудно је то једна од оних ствари које је наша група с љубављу назвала „структурни затвор“, јер би многи од нас неколико месеци само зурили у структуре и читали публикације како би покушали да открију у чему је проблем“, каже Гибалди.
Истраживачи су затим обучили неуронску мрежу графа пажње користећи ручно курирани скуп података да класификују структурне грешке као протоне који недостају, неравнотежу наелектрисања или кристалографски поремећај на основу атомског броја и оксидационог стања. Када су тестирали модел на новим скуповима података, укључујући материјале који нису МОФ, као што су мали молекули и комплекси прелазних метала, он је успешно класификовао до 96% грешака протона и поремећаја, надмашујући друге моделе класификације засноване на карактеристикама.

Јонгчул Чунг, научник за рачунарске материјале са Националног универзитета Пусан у Јужној Кореји, сматра да ће алат значити да истраживачи „не губе време на неке од структура које су пронашли, а које се испоставило да су нетачне.“
Осим класификације грешака, рад такође служи као правовремени подсетник да су модели машинског учења поуздани само онолико колико су подаци на којима су изграђени. „Мислим да је то нешто чега би људи требало да буду свесни у ширем контексту“, додаје Чунг. „Важно је не размишљати само о моделу, већ и о подацима на којима се обучава. Сам рад није баш нов, али вреди наставити.’
Затим ће се Воо-ов тим фокусирати на пречишћавање приказа графикона како би ефикасније ухватио геометрију и проширио врсте грешака које њихов модел може открити. „(Оно што) покушавамо да урадимо је да само померимо иглу мало ближе тако да те размене које имамо (између научника рачунарства и експеримента) буду много више укорењене у истом језику и да нису само потпуно раздвојене једна од друге“, каже Гибалди.
Чунг се слаже, напомињући да ће ови алати помоћи у изградњи поверења у рачунарску истраживачку заједницу и повезане скупове података.



