Utiliser l'IA pour créer des protéines au-delà de la nature

Par Mark Miller

L'apprentissage automatique et d'autres outils d'intelligence artificielle (IA) ont déjà été utilisés dans la recherche sur les protéines naturelles. Aujourd'hui, les biochimistes utilisent l'IA pour aller au-delà des modèles naturels et créer des protéines qui n'ont encore jamais existé. Mais comment l'IA reproduit-elle les processus naturels pour aider à construire des protéines à partir de rien, et quelles sont leurs applications potentielles ?

Un modèle de texte comme ChatGPT

Selon l'article "Les protéines jamais observées dans la nature sont conçues à l'aide de l'IA pour résoudre des problèmes biomédicaux et industriels non résolus par l'évolution", selon Michael Eisenstein dans Scientific American. Les modèles génératifs d'IA basés sur le langage - tel que celui utilisé par ChatGPT - peuvent être adaptés pour générer de nouvelles séquences et structures de protéines. En fait, un moyen efficace de comprendre les séquences de protéines est de les considérer comme du texte.

Dans ces applications, les algorithmes d'IA sont entrainés sur de grandes quantités d'informations biologiques, mais doivent également suivre des règles chimiques et biologiques - ou une "grammaire" biologique, comme l'appelle Eisenstein. "Pour générer une phrase ou un document fluide, l'algorithme doit apprendre les relations entre les différents types de mots, mais il doit également apprendre des faits sur le monde pour créer un document cohérent et logique", explique Ali Madani, fondateur de la société Profluent, spécialisée dans la conception de protéines, dans l'article. Avec cette technologie de modélisation basée sur du texte, l'IA peut aider à développer de nouvelles protéines, de la même manière que ChatGPT produit du texte en fonction de la langue sur laquelle il a été formé.

Images et Paysages

Si l'approche fondée sur un modèle linguistique s'avère efficace, elle n'est pas la seule option. Un programme appelé Chroma utilise des modèles de diffusion - typiquement utilisés dans les outils d'IA de génération d'images - qui sont capables de manipuler des données multidimensionnelles.

Faruck Morcos, professeur agrégé de sciences biologiques à l'université du Texas à Dallas (UT Dallas), utilise une variante de cette stratégie d'imagerie. Selon un article, lui et son équipe génèrent des paysages en 3D qui leur permettent de visualiser de nouvelles protéines. "Notre nouveau cadre est comme une carte routière", a déclaré M. Morcos. "Plutôt que d'analyser simplement les séquences de protéines existantes, nous examinons l'évolution des protéines et construisons des cartes en tenant compte des protéines qui existent déjà ainsi qu'en générant et en traçant des séquences potentielles."

"Pour les applications qui nous intéressent, comme la durabilité, la médecine, l'alimentation, la santé et la conception de matériaux, nous devrons aller au-delà de ce que la nature a fait."
- Markus Buehler, PhD, McAfee Professor of Engineering, Massachusetts Institute of Technology

La preuve est dans le pliage

L'un des défis majeurs de la conception et de la fabrication de nouvelles protéines réside dans la capacité à valider qu'elles fonctionneront comme des protéines naturelles plutôt que comme de simples chaînes aléatoires de composés chimiques.

Une équipe de chercheurs de l'université de Toronto teste ses protéines construites par l'IA à l'aide d'OmegaFold, une version du logiciel DeepMind AlphaFold 2. Grâce à ce système, ils ont pu confirmer que toute nouvelle séquence se pliait en une structure fonctionnelle. Cette validation revêt une importance cruciale car le pliage traduit une chaîne de protéines en une structure tridimensionnelle et permet de déterminer si elle adopte la forme correcte pour fonctionner. L'équipe a confirmé la viabilité de ses structures en créant des versions physiques en laboratoire.

La puissance des protéines

Étant donné que de nouvelles protéines peuvent être conçues pour des caractéristiques spécifiques, elles sont extrêmement prometteuses pour les applications biomédicales, industrielles et environnementales.

Un rapport du Massachusetts Institute of Technology (MIT) indique que si les nouvelles protéines peuvent poser des problèmes dans les applications biomédicales en raison de la méconnaissance de leurs propriétés, elles présentent un grand potentiel parce qu'elles peuvent être modelées sur les protéines naturelles existantes et adaptées pour répondre à des exigences spécifiques.

Dans le monde industriel, les nouvelles protéines peuvent être conçues pour répondre à des caractéristiques spécifiques.

Dans le monde industriel, les nouvelles protéines peuvent être utilisées pour fabriquer des matériaux dotés de propriétés de rigidité et de souplesse spécifiques afin de remplacer les matériaux à base de pétrole ou de céramique, mais avec une empreinte carbone beaucoup plus faible. Une autre possibilité est l'utilisation de enrobages alimentaires qui contribuent à maintenir les produits frais et comestibles pendant une plus longue durée.

"Pour les applications qui nous intéressent, comme le développement durable, la médecine, l'alimentation, la santé et la conception de matériaux, nous devrons aller au-delà de ce que la nature a fait", a déclaré Markus Buehler, PhD, McAfee Professor of Engineering au MIT.

Mark Miller est rédacteur pour Thermo Fisher Scientific.

Utiliser l'IA pour créer des protéines au-delà de la nature