Un nouvel outil en libre accès développé par des chercheurs en génie de l’Université de Toronto est sur le point de révolutionner la façon dont les scientifiques naviguent dans le monde en pleine expansion des structures métallo-organiques (MOF). Ces matériaux polyvalents, appréciés pour leur surface ultra-élevée et leur chimie ajustable, recèlent un immense potentiel dans des domaines allant de l’administration de médicaments et de la catalyse au captage du carbone. Cependant, suivre le rythme de l’accélération du volume de recherche sur les MOF est devenu un défi majeur – un défi auquel ce nouvel outil, nommé MOF-ChemUnity, répond directement.
La promesse et la complexité des MOF
Les structures organométalliques se distinguent par leur surface exceptionnelle : certaines variantes peuvent atteindre 7 000 m²/g, ce qui signifie qu’un seul gramme contient suffisamment de surface interne pour couvrir un terrain de football. Cette structure unique permet un large éventail d’applications. Les MOF peuvent agir comme des tamis moléculaires, capturant sélectivement le dioxyde de carbone des mélanges gazeux, ou comme des capteurs, détectant des traces de molécules. Leurs propriétés catalytiques peuvent accélérer les réactions industrielles, tandis que leur structure poreuse permet une libération contrôlée des médicaments.
L’importance des MOF a été récemment soulignée par le prix Nobel de chimie 2025. Pourtant, la simple croissance de la recherche – couvrant plus de 25 domaines d’application – a créé un goulot d’étranglement des connaissances, entravant à la fois les chercheurs humains et les outils d’IA conçus pour les aider.
Présentation de MOF-ChemUnity : un graphique de connaissances structuré
L’équipe du professeur Mohamad Moosavi du Département de génie chimique et de chimie appliquée et du Vector Institute ont développé MOF-ChemUnity pour surmonter ce défi. L’outil fonctionne comme un graphe de connaissances structuré et évolutif qui extrait et relie systématiquement les informations des documents de recherche MOF, des référentiels de structures cristallines et des bases de données informatiques sur les matériaux.
À la base, MOF-ChemUnity utilise un flux de travail multi-agents de modèle de langage étendu (LLM) pour relier les noms chimiques de la littérature scientifique à leurs structures cristallines correspondantes. Cela permet de représenter les procédures de synthèse, les propriétés des matériaux et les applications potentielles dans un format cohérent et lisible par machine.
« La découverte scientifique commence par la lecture et la synthèse de la littérature, mais cela reste l’une des étapes les plus difficiles à automatiser », explique Moosavi. « MOF-ChemUnity crée une base unifiée sur laquelle les chercheurs et les systèmes d’IA peuvent s’appuyer. »
Réduire les « hallucinations » de l’IA grâce à une littérature fondée
L’équipe a démontré l’impact de son système en intégrant le graphe de connaissances aux LLM pour créer un assistant d’IA basé sur la littérature pour les MOF. Contrairement aux systèmes d’IA standards enclins à générer des déclarations plausibles mais incorrectes (« hallucinations »), cet assistant s’appuie sur des enregistrements expérimentaux et informatiques vérifiés.
Dans les évaluations aveugles menées par des experts du MOF, les réponses de l’assistant ont été systématiquement jugées plus précises, interprétables et dignes de confiance que celles produites par des LLM de base comme GPT-4o. En fondant les réponses de l’IA sur une littérature organisée et liée, le système réduit considérablement le risque de raisonnement scientifique peu fiable.
« Cette approche réduit les hallucinations, qui constituent l’un des principaux obstacles à l’application de grands modèles de langage aux domaines scientifiques », explique Moosavi.
Libre accès et implications futures
L’équipe de l’Université de Toronto – dirigée par Moosavi, aux côtés des principaux contributeurs Thomas Pruyn et Amro Aswad – a rendu l’ensemble de données et le code librement disponibles sur GitHub, favorisant ainsi les progrès continus de la science des matériaux et de la recherche basée sur l’IA.
Moosavi considère MOF-ChemUnity comme un tremplin vers un changement plus large dans la façon dont les connaissances scientifiques sont organisées et accessibles. L’outil brise les silos dans la recherche, permettant aux systèmes d’IA de traiter les données dans tous les domaines, dépassant ainsi les limites des chercheurs humains.
“Les chercheurs humains sont limités par le nombre d’articles qu’ils peuvent lire, mais MOF-ChemUnity fait un premier pas vers la mise en place de systèmes d’IA capables de traiter des données dans tous les domaines. Il établit un nouveau paradigme pour la découverte fondée sur la littérature.”
Ces travaux accélèrent non seulement la découverte de matériaux, mais jettent également les bases de systèmes de connaissances généralisées susceptibles de révolutionner la recherche dans plusieurs disciplines scientifiques.
