Nowe, publicznie dostępne narzędzie opracowane przez naukowców z Wydziału Inżynierii Uniwersytetu w Toronto ma na celu zrewolucjonizowanie sposobu, w jaki naukowcy podchodzą do szybko rozwijającego się świata struktur metaloorganicznych (MOF). Cenione za bardzo dużą powierzchnię i przestrajalny skład chemiczny, te wszechstronne materiały mają ogromny potencjał w takich obszarach, jak dostarczanie leków, kataliza i wychwytywanie dwutlenku węgla. Jednakże utrzymanie tempa rosnącego wolumenu badań nad MOF stało się poważnym wyzwaniem, któremu bezpośrednio rozwiązuje to nowe narzędzie o nazwie MOF-ChemUnity.
Obietnica i złożoność MF
Podbudowy metaloorganiczne wyróżniają się wyjątkową powierzchnią – niektóre warianty wykazują aż do 7000 m²/g, co oznacza, że jeden gram zawiera powierzchnię wewnętrzną wystarczającą do pokrycia boiska piłkarskiego. Ta unikalna struktura pozwala na ich wykorzystanie w szerokim zakresie zastosowań. MOF mogą działać jak sita molekularne, selektywnie pochłaniając dwutlenek węgla z mieszanin gazowych, lub jako czujniki wykrywające śladowe ilości cząsteczek. Ich właściwości katalityczne mogą przyspieszyć reakcje przemysłowe, a ich porowata struktura pozwala na kontrolowane uwalnianie leku.
Znaczenie MOF zostało niedawno podkreślone przez Nagrodę Nobla w dziedzinie chemii za rok 2025. Jednak sam rozwój badań – obejmujących ponad 25 obszarów zastosowań – stworzył wąskie gardło w wiedzy, utrudniając zarówno pracę naukowców, jak i narzędzia AI zaprojektowane do ich wspierania.
Przedstawiamy MOF-ChemUnity: ustrukturyzowany wykres wiedzy
Aby przezwyciężyć ten problem, zespół profesora Mohamada Mousaviego z Wydziału Inżynierii Chemicznej i Chemii Stosowanej oraz Instytutu Vector opracował MOF-ChemUnity. Narzędzie działa jako ustrukturyzowany, skalowalny wykres wiedzy, który systematycznie wyodrębnia i łączy informacje z artykułów naukowych MOF, repozytoriów struktur krystalicznych i obliczeniowych baz danych.
Sercem MOF-ChemUnity jest wieloagentowy model dużego języka (LLM), który wiąże nazwy chemiczne w literaturze naukowej z odpowiadającymi im strukturami krystalicznymi. Umożliwia to przedstawienie procedur syntezy, właściwości materiałów i potencjalnych zastosowań w spójnym formacie nadającym się do odczytu maszynowego.
„Odkrycia naukowe rozpoczynają się od czytania i syntezy literatury, ale pozostaje to jeden z najtrudniejszych etapów do zautomatyzowania” – wyjaśnia Mousavi. „MOF-ChemUnity tworzy jednolity fundament, na którym mogą budować zarówno badacze, jak i systemy sztucznej inteligencji”.
Ograniczanie „halucynacji” sztucznej inteligencji poprzez literaturę opartą na dowodach
Zespół zademonstrował wpływ swojego systemu, integrując wykres wiedzy z LLM, aby stworzyć opartego na literaturze asystenta AI dla MOF. W przeciwieństwie do standardowych systemów sztucznej inteligencji, które mają tendencję do generowania wiarygodnych, ale niepoprawnych stwierdzeń („halucynacji”), ten asystent opiera się na sprawdzonych danych eksperymentalnych i obliczeniowych.
W ślepych testach przeprowadzonych przez ekspertów MOF odpowiedzi asystenta były konsekwentnie oceniane jako dokładniejsze, zrozumiałe i godne zaufania niż odpowiedzi udzielone w przypadku podstawowych LLM, takich jak GPT-4o. Opierając odpowiedzi AI na wyselekcjonowanej i powiązanej literaturze, system znacznie zmniejsza ryzyko nierzetelnego rozumowania naukowego.
„Takie podejście zmniejsza halucynacje, co jest jedną z głównych przeszkód w stosowaniu dużych modeli językowych w dziedzinach nauki” – mówi Mousavi”.
Otwarty dostęp i przyszłe implikacje
Zespół z Uniwersytetu w Toronto — kierowany przez Mousaviego oraz kluczowych współpracowników Thomasa Pruyna i Amro Aswada — udostępnił publicznie zbiór danych i kod w serwisie GitHub, ułatwiając dalszy postęp w materiałoznawstwie i badaniach opartych na sztucznej inteligencji.
Mousavi postrzega MOF-ChemUnity jako krok w kierunku szerszych zmian w organizacji i dostępu do wiedzy naukowej. Narzędzie przełamuje bariery w badaniach, umożliwiając systemom AI przetwarzanie danych w różnych obszarach, przekraczając możliwości badaczy-ludzi.
„Badacze są ograniczeni liczbą artykułów, które mogą przeczytać, ale MOF-ChemUnity robi pierwszy krok w kierunku umożliwienia systemom sztucznej inteligencji przetwarzania danych z różnych dziedzin. Wyznacza to nowy paradygmat odkryć opartych na literaturze.”
Praca ta nie tylko przyspiesza odkrywanie materiałów, ale także kładzie podwaliny pod uogólnione systemy wiedzy, które mogą zrewolucjonizować badania w różnych dyscyplinach naukowych.
