Рентгеновская спектроскопия поглощения –  из самых мощных инструментов изучения вещества. Однако до сих пор расшифровка спектров напоминала детектив с открытым финалом: ученые тратили месяцы на интерпретацию данных, полагаясь на опыт, интуицию и сложные расчёты. Теперь этот процесс занимает всего несколько минут благодаря разработке исследователей.

Если Россия – родина слонов, то Ростов-на-Дону по праву может называться родиной рентгеновской спектроскопии. Чтобы изучать мельчайшие детали строения вещества, ученые используют мощнейшие источники рентгеновского излучения. Как правило, «чем меньше объект, тем больше микроскоп» – потому по всему миру люди строят монструозные синхротроны и лазеры на свободных электронах, чтобы узнать мельчайшие детали строения и функционирования вещества.

Эти установки, яркость которых сравнима с “миллионом Солнц”, позволяют “просветить” материал и по его отклику, «тени», определить расположение атомов, их химическое состояние и другие ключевые параметры – это и зовётся рентгеновской спектроскопией поглощения.

Так устанавливаются важнейшие детали строения и функционирования самых разных материалов и веществ, от активных центров энзимов и ферментов, лежащих в основе всего живого, до особенностей структуры материальной базы микроэлектроники или механизмов работы и деградации катализаторов: веществ, на порядок ускоряющих химические реакции, и потому лежащих в основе практически всей промышленной химии, – рассказал лаборант-исследователь фронтирной лаборатории рентгеноспектральной нанометрологии МИИ ИМ ЮФУ Богдан Проценко.

Однако, есть нюансы: даже имея рабочую установку и успешно измерив на ней данные для своих объектов, учёные часто не знают наверняка, что с этим делать дальше, поскольку на данный момент не существует (и вряд ли будет, по крайней мере, в привычном для нас понимании) такой формулы, по которой можно однозначно расшифровать спектр рентгеновского поглощения.

Исследование превращается в детектив, причём с открытым концом. Действительно, расшифровка таких данных – это искусство, часто требующее, помимо специфических знаний в этой области, ещё и помощи квантовой химии, кристаллографии, смежных методик и других сфер научных знаний для получения наилучших результатов. Но так было до текущего момента!

В недавнем исследовании учёные Международного исследовательского института интеллектуальных материалов ЮФУ совместно с зарубежными коллегами сделали первые шаги к тому, чтобы автоматизировать и стандартизировать анализ данных рентгеновской спектроскопии поглощения, сделав их анализ быстрым, точным и доступным каждому.

Так, новый подход ускоряет полгода ручной работы до пары минут благодаря машинному обучению, а также превращает привычные выводы из разряда «ну скорее всего степень окисления активного центра катализатора больше +3, но меньше +5, но это не точно» в «степень окисления +4.5 с ошибкой такой-то».

Примечательно, что разработанный код открыт и реализован в виде наглядных «ноутбуков», и чтобы применять машинное обучение в этой области, теперь не нужно даже уметь программировать.

Используя машинное обучение на основе фреймворка PyFitIt (который уже много лет разрабатывается в нашем Институте), а также исчерпывающие базы данных (пока только для хрома и ванадия, но даже это существенно – например, соединения хрома лежат в основе катализатора Филлипса, с помощью которого производится половина всего полиэтилена в мире), мы добились высококачественных и воспроизводимых результатов, – отметил Богдан Проценко.

В машинном обучении и науке о данных – разделах пресловутого искусственного интеллекта – данные и их качество порой значат больше самих алгоритмов ИИ, и потому для получения надёжных и воспроизводимых результатов была проделана кропотливая работа по сбору качественных данных: специально для этого были собраны качественные коммерческие и специально синтезированы новые соединения-эталоны, покрывающие все возможные комбинации и локального окружения, и степеней окисления, и межатомных расстояний. Для каждого образца на одном и том же синхротроне единообразно измерен спектр, причём структура подтверждена целым набором методов: дифракцией, ядерным магнитным резонансом, инфракрасной спектроскопией – словом, проделан большой объём аккуратной рутинной работы с привлечением множества различных методик.

Все эти данные собраны в единую базу данных, на которой обучены алгоритмы ИИ. Для них реализовано всё необходимое, по последнему писку моды в машинном обучении: отбор, аргументация и фильтрация данных, необходимая для спектров предобработка, выбор признаков, перекрёстная валидация и сравнение алгоритмов, оценка ошибок и проверка возможности экстраполяции найденных зависимостей – и всё это полностью автоматизировано.

Кроме того, в работе впервые предложена процедура совместного анализа соседних краёв поглощения для разных элементов (“два в одном”), увеличивающая точность анализа.

Всё это упаковано в удобную user-friendly оболочку, готовую к анализу неизвестных спектров. Практическая ценность подхода продемонстрирована на примере интересного нанесённого ванадиевого катализатора для окислительного дегидрирования, где учёные смогли установить механизм его деградации, что иллюстрирует простоту и эффективность нового подхода.

Результаты исследования изложены в журнале первого квартиля «The Journal of Physical Chemistry C»  Американского химического сообщества (ACS).

Текст: Сопрунова Ю.Г., ред: Молоткова О.А.

Один комментарий к “Полгода работы за минуту: российские ученые научили ИИ расшифровывать спектры”
  1. Поздравляю земляков с научным прорывом!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *