Nouvelle ère en matière d’innovation, l’intelligence artificielle, l’IA, s’installe dans le domaine de la santé et notamment de la recherche pharmaceutique.

Trouver ou développer des protéines ayant exactement les bonnes propriétés pour créer des médicaments efficaces est extrêmement complexe. Ce n’est que ces dernières années que les premières petites molécules basées sur l’IA sont passées aux essais cliniques, ouvrant ainsi une nouvelle ère dans la recherche de médicaments.

Même avec les technologies les plus récentes, savoir comment ajuster précisément une protéine pour améliorer sa fonction représente un grand défi, qui dépasse les capacités de l’homme seul et qui est extrêmement difficile à résoudre même à l’aide de processus de calculs traditionnels. Ce problème se prête toutefois très bien à l’utilisation de l’intelligence artificielle.

Afin d’exploiter pleinement les atouts de ces nouvelles technologies, certaines start-ups, comme LabGenius, développent un système automatisé avec une prise de décision basée sur le ML (Machine Learning) permettant l’accélération de la recherche de traitements avancés contre le cancer et les maladies inflammatoires. En combinant l’intelligence artificielle, la biologie synthétique et l’automatisation des laboratoires, l’entreprise de biotechnologie développe des produits thérapeutiques à base d’anticorps de la prochaine génération. Mais concrètement, comment s’actionne cette révolution technologie médicale ? Explications.

L’industrie des semi-conducteurs sauvent des vies

Les semi-conducteurs sont sans conteste indispensables à la réalisation d’équipements vitaux : IRM, pacemakers, ou encore glucomètres. Depuis 2 ans, la pénurie est un enjeu en matière de fabrication d’appareils médicaux mais pas seulement dans ce domaine. L’industrie des semi-conducteurs développe des accélérateurs pour l’IA permettant l’utilisation de l’apprentissage automatique pour l’ingénierie des protéines. Ces nouvelles technologies offrent les meilleures performances possibles en matière de calcul de l’IA accélérant ainsi le développement de médicaments.

Les techniques et technologies impliquées n’ont que récemment atteint le niveau de maturité nécessaire à une telle entreprise. Lorsque les systèmes IPU de Graphcore (Intelligence Processing Unit, le microprocesseur le plus sophistiquée au monde) ont permis de réduire de moitié (passant d’un mois à deux semaines) les délais d’entraînement de modèles d’IA, les chercheurs de LabGenius, société biotechnologique Londienne, pionnière de l’utilisation de l’apprentissage automatique pour l’ingénierie des protéines, ont réalisé qu’ils avaient désormais à leur disposition un nouvel outil puissant pour les aider à innover. Avec un modèle comprenant toutes les protéines requises, les chercheurs peuvent désormais réaliser beaucoup plus d’expériences et obtenir bien plus de résultats.

Des données complètes et pertinentes

En alliant intelligence artificielle (IA), biologie synthétique et automatisation en laboratoire, des sociétés comme LabGenius, cherche à développer des thérapies à anticorps nouvelle génération. À la recherche de la composition protéique parfaite, les protéines sont séquencées, analysées de manière intelligente, modifiées et re-synthétisées. La société se concentre sur l’accélération de la recherche de traitements avancés contre le cancer et les maladies inflammatoires. Pour cela, la collecte et le partage des données de santé sont au cœur du déploiement des nouvelles technologies de soin.

Quiconque visite le laboratoire médical peut constater de l’importance de la partie physique du processus : les machines de manipulation des liquides remplissent les échantillons, qui sont récupérés par des bras robotiques et transférés à l’étape suivante de du processus. C’est là qu’entre en jeu la science des données et vient renforcer la recherche en laboratoire.

Selon le Dr Katya Putintseva, Machine Learning Advisor, LabGenius, le problème majeur à surmonter pour l’IA, si l’on compare au traitement automatique des langues ou à la reconnaissance d’images, est la rareté des données de haute qualité correspondant aux caractéristiques recherchées. Il y a beaucoup de données, mais le diable se cache toujours dans les détails. Comment cet ensemble de données a-t-il été créé ? Que contient-il ? Dans quelles mesures le signal qui en a été extrait peut-il être extrapolé au sein de la séquence ?

La plateforme robotique de LabGenius génère et classifie les données de façon adéquate et au niveau de qualité requis pour les modèles d’apprentissage automatique. Elle ajoute « Nous sommes convaincus que le moment est venu de créer des ensembles de données de haute qualité, complets et pertinents en biologie ».

Optimiser et conseiller

À l’aide d’ensembles de données haute qualité et soigneusement sélectionnés, LabGenius est en mesure de tirer parti de l’intelligence artificielle pour résoudre les plus grands défis liés au développement de nouvelles thérapies basées sur des protéines, dont l’un est bien connu du monde de l’IA : comment optimiser un grand nombre de variables au sein de systèmes très complexes ?

« Nous appelons cela co-optimisation ou optimisation à objectifs multiples », explique Tom Ashworth, à la tête de l’équipe Technologie de LabGenius. « Si vous essayez d’optimiser la force des molécules, il convient également de préserver leur intégrité ou d’autres caractéristiques, comme leur stabilité. ».

L’IA influence également la manière de mener ses expériences : « Le système permet d’identifier divers aspects de la molécule qu’il est possible d’améliorer : mutations ponctuelles de constructions simples, composition globale, ou encore topologie de protéines multi-modules. Tout ceci en nous conseillant sur les étapes d’optimisation suivantes, ce processus nous apprend à identifier les changements et à les mettre en œuvre », explique M. Ashworth.

Les bénéfices de l’utilisation des IPU

L’utilisation des puces IPU représentent un nouvel outil important dans la course aux nouvelles innovations. LabGenius utilise la puissance de calcul de l’Intelligence Processing Unit (IPU) du fabricant européen de puces d’intelligence artificielle Graphcore pour accélérer l’entraînement de BERT – le modèle de transformation, surtout connu pour le traitement du langage naturel, et trouve désormais un champ d’application de plus en plus large, y compris dans la biotechnologie.

Les chercheurs prennent une grande quantité de protéines connues et tentent de prédire les acides aminés masqués à partir des données d’entraînement via BERT, ce qui leur permet d’en apprendre davantage sur la biophysique fondamentale des protéines, explique le Dr Putintseva : « Les valeurs cachées de ce modèle nous aident donc à créer des représentations significatives des protéines que nous utilisons ensuite pour façonner la caractéristique souhaitée« .

Selon Tom Ashworth, le fait que les temps d’entraînement d’un modèle d’IA, qui doit régulièrement être entraîné, aient pu être réduits de manière aussi drastique grâce au IPU de Graphcore, donne à LabGenius un avantage considérable dans ce secteur très concurrentiel. Les scientifiques des données affirment que cela représente un vrai changement, leur permettant d’avancer la vitesse de leur pensée, et pour une startup comme LabGenius, une rapidité de réaction et d’évolution est essentielle.

L’utilisation de l’intelligence artificielle est primordiale pour la médecine de demain et les principes fondamentaux qui découlent de ces recherches peuvent toutefois être appliqués de manière beaucoup plus large.

LabGenius veut maintenant étendre l’utilisation des modèles entraînés avec Graphcore. Ainsi, les modèles continueront d’être utilisés dans la phase de découverte et pour mieux comprendre la capacité de développement de leurs molécules. De plus, l’entreprise commence maintenant à développer de nouveaux modèles d’IA sur les systèmes Graphcore, y compris les GNN (Graph Neural Networks).
__________________

Par Alex Titterton, Ingénieur d’applications en l’IA de Graphcore

 


A LIRE AUSSI

La transformation du secteur santé : une question d’équilibre entre IA et robotique

Le secteur des médias fait sa révolution autour des données