Новый метод позволяет лучше прогнозировать свойства материалов с использованием данных низкого качества

У достижений в энергетических технологиях, здравоохранении, производстве полупроводников и пищевых продуктов есть одна общая черта: они основаны на разработке новых материалов — новых комбинаций атомов, которые обладают особыми свойствами, позволяющими им выполнять необходимую функцию. В недалеком прошлом единственным способом узнать, какими свойствами обладает материал, было выполнение экспериментальных измерений или очень дорогостоящие вычисления.


Совсем недавно ученые использовали алгоритмы машинного обучения, чтобы быстро предсказать свойства, которыми будет обладать определенное расположение атомов. Проблема с этим подходом заключается в том, что для обучения модели требуется много высокоточных данных, которых часто не существует.

Объединив большие объемы данных с низкой точностью с меньшими объемами данных с высокой точностью, наноинженеры из виртуальной лаборатории материалов в Калифорнийском университете в Сан-Диего разработали новый метод машинного обучения для прогнозирования свойств материалов с большей точностью, чем существующие модели. Важно отметить, что их подход также является первым, предсказывающим свойства неупорядоченных материалов — тех, у которых атомные позиции могут быть заняты более чем одним элементом или могут быть свободными. Они подробно рассказали о своем подходе к сетям графов с множественной точностью 14 января в Природа вычислительной науки.

«Когда вы разрабатываете новый материал, одна из ключевых вещей, которую вы хотите знать, — это то, будет ли этот материал стабильным и какими свойствами он обладает», — сказал Шью Пинг Онг, профессор наноинженерии в Калифорнийском университете Сан Инженерная школа Диего Джейкобса и автор статьи. «Основная проблема заключается в том, что трудно получить ценные точные данные, такие как экспериментальные измерения, даже несмотря на то, что у нас есть большие базы данных с менее точными вычисленными свойствами. Здесь мы пытаемся получить лучшее из обоих миров — объединить большой низкий -данные и более мелкие высокоточные данные для повышения точности моделей при прогнозировании высокой ценности ».

Хотя существуют и другие подходы с множественной точностью, эти методы плохо масштабируются или ограничиваются только двумя степенями точности данных. Они не так точны или динамичны, как этот новый подход к сети на основе графов с множественной точностью, который может работать с неограниченным количеством верностей данных и может быть очень быстро масштабирован.

В этой статье наноинженеры специально рассмотрели ширину запрещенной зоны материалов — свойство, используемое для определения электропроводности, цвета материала, эффективности солнечных элементов и т. Д. — в качестве подтверждения концепции. Их сети графов с множественной точностью привели к снижению средних абсолютных ошибок экспериментальных предсказаний ширины запрещенной зоны на 22-45% по сравнению с традиционным подходом с одинарной точностью. Исследователи также показали, что их подход может точно предсказать молекулярную энергию с высокой точностью.

«Нет принципиальных ограничений в отношении того, к каким свойствам это можно применить», — сказал Онг. «Вопрос в том, о каких свойствах мы располагаем данными».

В ближайшем будущем команда Онга планирует использовать этот новый метод для разработки лучших материалов для хранения энергии, фотоэлектрических элементов и полупроводниковых устройств.

Прогнозируя свойства упорядоченных материалов, команда сделала еще одно случайное открытие — в модели глубокого обучения графа, которую они используют, атомарные атрибуты представлены в виде вектора встраивания длины 16. Интерполируя эти изученные векторы встраивания, исследователи обнаружили, что они также могут создать прогностическую модель для неупорядоченных материалов, у которых есть атомные позиции, которые могут быть заняты более чем одним элементом или временами могут быть пустыми, что затрудняет их изучение с использованием традиционных методов. методы.

0 Комментарий
Inline Feedbacks
View all comments