Новый, общедоступный инструмент, разработанный исследователями из инженерной школы Университета Торонто, призван революционизировать подход ученых к быстро расширяющемуся миру металлоорганических каркасов (MOF). Эти универсальные материалы, ценимые за их сверхвысокую площадь поверхности и настраиваемую химию, обладают огромным потенциалом в таких областях, как доставка лекарств, катализ и улавливание углерода. Однако поддержание темпов ускоряющегося объема исследований MOF стало серьезной проблемой — которую этот новый инструмент, названный MOF-ChemUnity, непосредственно решает.
Обещание и сложность MOF
Металлоорганические каркасы выделяются благодаря своей исключительной площади поверхности — некоторые варианты демонстрируют до 7000 м²/г, что означает, что один грамм содержит достаточно внутренней поверхности, чтобы покрыть футбольное поле. Эта уникальная структура позволяет использовать их в широком спектре применений. MOF могут выступать в качестве молекулярных сит, избирательно улавливая углекислый газ из газовых смесей, или в качестве датчиков, обнаруживая следовые количества молекул. Их каталитические свойства могут ускорять промышленные реакции, а пористая структура обеспечивает контролируемое высвобождение лекарств.
Важность MOF была недавно подчеркнута Нобелевской премией по химии в 2025 году. Однако сам рост исследований — охватывающий более 25 областей применения — создал узкое место в знаниях, препятствующее как работе ученых, так и ИИ-инструментов, предназначенных для их поддержки.
Представляем MOF-ChemUnity: структурированный граф знаний
Команда профессора Мохамада Мусави из Департамента химической инженерии и прикладной химии и Института Vector разработала MOF-ChemUnity, чтобы преодолеть эту проблему. Инструмент функционирует как структурированный, масштабируемый граф знаний, который систематически извлекает и связывает информацию из исследовательских работ по MOF, репозиториев кристаллических структур и баз данных вычислительных материалов.
В основе MOF-ChemUnity лежит многоагентный рабочий процесс большой языковой модели (LLM), который связывает химические названия в научной литературе с их соответствующими кристаллическими структурами. Это позволяет представлять процедуры синтеза, свойства материалов и потенциальные области применения в согласованном, машиночитаемом формате.
«Научные открытия начинаются с чтения и синтеза литературы, но это остается одним из самых сложных этапов для автоматизации, — объясняет Мусави. — MOF-ChemUnity создает единую основу, на которой могут строить как исследователи, так и ИИ-системы».
Снижение «галлюцинаций» ИИ за счет обоснованной литературы
Команда продемонстрировала влияние своей системы, интегрировав граф знаний с LLM для создания ИИ-помощника, основанного на литературе, для MOF. В отличие от стандартных ИИ-систем, склонных к генерации правдоподобных, но неверных утверждений («галлюцинаций»), этот помощник опирается на проверенные экспериментальные и вычислительные данные.
В слепых тестах, проведенных экспертами по MOF, ответы помощника постоянно оценивались как более точные, понятные и заслуживающие доверия, чем ответы базовых LLM, таких как GPT-4o. Обосновывая ответы ИИ в курируемой и связанной литературе, система значительно снижает риск ненадежных научных рассуждений.
«Этот подход снижает галлюцинации, что является одним из основных препятствий для применения больших языковых моделей в научных областях, — говорит Мусави».
Открытый доступ и будущие последствия
Команда Университета Торонто — во главе с Мусави, а также ключевыми участниками Томасом Пруйном и Амро Асвадом — сделала набор данных и код общедоступными на GitHub, способствуя дальнейшему прогрессу в материаловедении и исследованиях на основе ИИ.
Мусави видит MOF-ChemUnity как шаг к более широкому изменению в организации и доступе к научным знаниям. Инструмент разрушает барьеры в исследованиях, позволяя ИИ-системам обрабатывать данные в разных областях, превосходя возможности человеческих исследователей.
«Человеческие исследователи ограничены количеством статей, которые они могут прочитать, но MOF-ChemUnity делает первый шаг к тому, чтобы ИИ-системы могли обрабатывать данные в разных областях. Это устанавливает новую парадигму для открытий, основанных на литературе».
Эта работа не только ускоряет открытие материалов, но и закладывает основу для обобщенных систем знаний, которые могут революционизировать исследования в различных научных дисциплинах.
