Nový nástroj AI usnadňuje vyhledávání metal-organic frameworks

19

Nový, veřejně dostupný nástroj vyvinutý výzkumníky na Fakultě inženýrství University of Toronto má za cíl změnit způsob, jakým vědci přistupují k rychle se rozšiřujícímu světu metal-organic frameworks (MOF). Tyto všestranné materiály, ceněné pro svou ultra vysokou povrchovou plochu a laditelnou chemii, mají obrovský potenciál v oblastech, jako je dodávání léků, katalýza a zachycování uhlíku. Udržení tempa zrychlujícího se objemu výzkumu MOF se však stalo velkou výzvou, kterou tento nový nástroj nazvaný MOF-ChemUnity přímo řeší.

Příslib a komplexnost MOF

Kovově organické konstrukce vynikají díky své výjimečné ploše – některé varianty vykazují až 7 000 m²/g, což znamená, že jeden gram obsahuje dostatek vnitřní plochy k pokrytí fotbalového hřiště. Tato jedinečná struktura umožňuje jejich použití v široké škále aplikací. MOF mohou fungovat jako molekulární síta, selektivně sekvestrující oxid uhličitý ze směsí plynů, nebo jako senzory, které detekují stopová množství molekul. Jejich katalytické vlastnosti mohou urychlit průmyslové reakce a jejich porézní struktura umožňuje řízené uvolňování léčiva.

Důležitost MOF nedávno zdůraznila Nobelova cena za chemii za rok 2025. Samotný růst výzkumu – zahrnujícího více než 25 aplikačních oblastí – však vytvořil překážku ve znalostech, která brzdí jak práci vědců, tak nástroje AI určené k jejich podpoře.

Představujeme MOF-ChemUnity: strukturovaný graf znalostí

Tým profesora Mohamada Mousaviho z katedry chemického inženýrství a aplikované chemie a Vector Institute vyvinul MOF-ChemUnity k překonání tohoto problému. Nástroj funguje jako strukturovaný, škálovatelný graf znalostí, který systematicky extrahuje a propojuje informace z výzkumných prací MOF, úložišť krystalových struktur a výpočetních databází.

Srdcem MOF-ChemUnity je pracovní postup multiagentního velkého jazykového modelu (LLM), který spojuje chemické názvy ve vědecké literatuře s jejich odpovídajícími krystalovými strukturami. To umožňuje, aby byly postupy syntézy, vlastnosti materiálů a potenciální aplikace prezentovány v konzistentním, strojově čitelném formátu.

„Vědecký objev začíná čtením a syntézou literatury, ale to zůstává jedním z nejobtížnějších kroků k automatizaci,“ vysvětluje Mousavi. „MOF-ChemUnity vytváří jednotný základ, na kterém mohou stavět výzkumníci i systémy umělé inteligence.“

Snížení „halucinací“ umělé inteligence prostřednictvím literatury založené na důkazech

Tým prokázal dopad svého systému integrací znalostního grafu s LLM, aby vytvořil asistenta umělé inteligence založeného na literatuře pro MOF. Na rozdíl od standardních systémů umělé inteligence, které mají tendenci generovat věrohodná, ale nesprávná prohlášení („halucinace“), spoléhá tento asistent na ověřená experimentální a výpočetní data.

V slepých testech prováděných odborníky MOF byly odpovědi asistenta trvale hodnoceny jako přesnější, srozumitelnější a důvěryhodnější než odpovědi základních LLM, jako je GPT-4o. Uzemněním odpovědí umělé inteligence ve vybrané a související literatuře systém výrazně snižuje riziko nespolehlivého vědeckého uvažování.

“Tento přístup snižuje halucinace, které jsou jednou z hlavních překážek aplikace velkých jazykových modelů ve vědeckých oborech,” říká Mousavi.

Otevřený přístup a budoucí důsledky

Tým University of Toronto – vedený Mousavim a také klíčovými přispěvateli Thomasem Pruynem a Amrem Aswadem – zpřístupnil datovou sadu a kód veřejně na GitHubu, což usnadnilo další pokrok ve vědě o materiálech a výzkumu založeném na umělé inteligenci.

Músáví vidí MOF-ChemUnity jako krok k širší změně v organizaci a přístupu k vědeckým poznatkům. Nástroj boří bariéry ve výzkumu tím, že umožňuje systémům umělé inteligence zpracovávat data v různých oblastech, čímž překonává možnosti lidských výzkumníků.

„Lidští výzkumníci jsou omezeni počtem dokumentů, které mohou číst, ale MOF-ChemUnity dělá první krok k tomu, aby systémy umělé inteligence mohly zpracovávat data napříč obory. To nastavuje nové paradigma pro objevování založené na literatuře.”

Tato práce nejen urychluje objevy materiálů, ale také pokládá základy pro zobecněné znalostní systémy, které mohou způsobit revoluci ve výzkumu v různých vědeckých disciplínách.