De Spoutnik à GPT-4, du premier satellite à l’avènement de l’intelligence artificielle, plongez dans une histoire d’innovation et d’efficacité. Découvrez comment l’efficacité doit guider le choix des entreprises en matière d’IA et pourquoi le futur pourrait bien appartenir aux modèles open-source.

En 1957, Spoutnik donnait le coup d’envoi de la course à l’espace et à l’innovation spatiale avec l’expédition du premier satellite en orbite autour de la terre. Soixante-six ans plus tard, c’est GPT-3 et, par la suite GPT-4 qui ont donné lieu à un grand bouleversement technologique en mettant un coup de pied dans la fourmilière de l’intelligence artificielle (IA).

L’efficacité comme maître mot

Ces modèles de langage ultra larges ont joué un rôle crucial dans la prise de conscience générale du potentiel de l’intelligence artificielle en permettant au grand public d’interagir avec une IA de pointe et d’expérimenter sa capacité à créer du contenu, à réaliser des traductions et même à écrire du code informatique facilement.

Alors qu’une poignée de modèles d’IA célèbres attirent l’attention, des centaines d’autres modèles moins connus sont apparus dans les dernières années et sont utilisés à des fins commerciales comme GPT-J, Pythia, Dolly et Whisper. Ces plus petits modèles, souvent open-source, peuvent être optimisés pour des applications spécifiques.

Pourquoi les start-up mais aussi les grosses entreprises de l’intelligence artificielle cherchent ce type de modèles plus spécifiques ? En un mot : pour l’efficacité ! Les entreprises fondées sur toutes les technologies, IA incluse, ont tendance à exiger la rentabilité et souhaite utiliser les outils appropriés à l’utilisation qu’ils en font. De plus, ces modèles peuvent être utilisés et adaptés sans payer de frais continus ou de royalties.

Une affirmation soutenue par Google qui déclare « les modèles open-source sont plus rapides, plus personnalisables, plus privés et plus performants. Ils font des choses avec 100 dollars et 13 milliards de paramètres que nous avons du mal à faire avec 10 millions de dollars et 540 milliards de paramètres. Et ils le font en quelques semaines, pas en quelques mois ».

En outre, cette diversité de modèles open-source, adaptable à des tâches spécifiques pourra s’avérer être une solution viable à long terme pour les entreprises.

Les modèles comptent et les calculs aussi

Si ces 10 dernières années, l’industrie de l’IA était principalement concentrée sur les recherches laboratoires, le coût ou le nombre de processeurs requis pour être efficace n’étaient pas la préoccupation principale. Cela n’avait pas d’importance s’il fallait 2 jours ou 2 semaines pour aboutir à quelque chose.

Bien que la recherche se poursuive, à l’heure où de nombreuses entreprises intègrent l’IA générative, des interrogations subsistent concernant son déploiement ainsi que son applicabilité commerciale car nous entrons désormais dans la phase de déploiement de l’IA. Ici, l’histoire est vraiment différente et les entreprises utilisatrices de l’IA sont demandeuses de plus d’efficacité pour leur matériel informatique.

Malgré le fait que les GPU soient les puces les plus utilisées, l’architecture d’un IPU (Intelligence Processing Unit) permet d’utiliser plus de noyaux de traitement. Grâce à cette productivité, de nombreuses options s’offrent aux entreprises pour en tirer le meilleur parti comme par exemple acheter plus de calculs pour le même montant prévisionnel si le but est d’avoir des résultats plus rapides, ou acheter le même montant de calculs pour moins cher si le but est la rentabilité économique ou la réduction de la consommation d’énergie. Ce sont deux formes d’efficacité différentes parmi tant d’autres.

Quel que soit l’objectif, cet impératif d’efficacité commerciale, tant dans les modèles que dans le matériel de calcul, sera un facteur déterminant dans la progression de l’intelligence artificielle. Outre la célébrité ou une présence de longue date dans le secteur de l’IA, ce seront bientôt les résultats réels qui compteront.
____________________________

Par Gautier Soubrane, directeur commercial EMEA pour Graphcore

 

À lire également :

Comment l’IA accélère la recherche pharmaceutique et le développement de médicaments ?

L’Open Source, un élément clé pour assurer l’avenir de la souveraineté numérique européenne

IA générative : menaces et risques pour la cybersécurité

L’usine du futur : pilotée par la donnée et optimisée par l’IA ?

Le cloud : une clé pour libérer le plein potentiel de l’IA pour les entreprises ?

400 millions de dollars pour des processeurs dédiés à l’AI