La montée des SLM et LLM repousse les limites de l’innovation et de la transformation numérique des métiers, mais leur choix reste une étape stratégique pour maximiser leur impact. Bien prendre en compte la taille, les capacités et le contexte d’application mais aussi le type de modèles permet de dénicher les modèles qui allient la meilleure efficacité et pertinence métier au moindre coût pour assurer le ROI des projets IA. Voici comment bien choisir…

Les Large Language Models (LLM) – ces systèmes d’IA capables de comprendre et de générer du texte en langage naturel grâce à l’apprentissage sur de vastes ensembles de données – génèrent des percées et des rendements significatifs dans toutes les industries. IDC prévoit que d’ici 2028, 80 % des responsables de l’information s’appuieront sur des outils d’IA générative pour accélérer l’analyse, stimuler la prise de décision, améliorer le service client, et plus encore.

En disposant d’un large éventail de LLM, les entreprises sont plus susceptibles de trouver celui qui répond à leurs besoins spécifiques pour accélérer l’innovation. Mais le choix parmi les centaines de modèles disponibles peut être compliqué.

Les types de modèles sont les suivants :

* Modèles commerciaux : Populaires dans les secteurs des soins de santé et des services financiers, ils sont couramment utilisés pour des projets impliquant des restrictions d’adaptation spécialisées ou de sécurité.

* Modèles open source : En raison de leur accessibilité et de leur attrait financier, ils sont souvent utilisés dans la recherche, ainsi que par les start-ups et les petites organisations.

* Modèles à usage général : ils sont formés sur de grandes quantités de données et peuvent être utilisés comme modèles de base pour la construction d’applications d’IA sur-mesure.

* Modèles spécifiques à un domaine : ils sont formés pour s’adapter à un cas particulier d’industrie ou d’utilisation, tels que les soins de santé ou les services financiers.

* Modèles spécifiques aux tâches : ils personnalisés sont optimisés pour une fonction unique de traitement du langage naturel (NLP), telles que la synthèse, les réponses aux questions ou la traduction.

* Modèles de langage de vision : Surnommés VLM, ces modèles combinent la vision par ordinateur et le NLP pour générer des images à partir de descriptions de texte et reconnaître des objets à partir d’images.

Il est également important de considérer la taille d’un modèle, car cela affectera ses capacités et ses limites.
Certains critères clés sont à étudier :

* Vitesse d’inférence : Les modèles plus petits fournissent généralement des temps d’inférence plus rapides, permettant un traitement en temps réel et augmentant l’efficacité énergétique et les économies de coûts.

* Précision : Les modèles de plus grande taille améliorés par la génération augmentée par récupération (RAG), offrent souvent une plus grande précision.

* Déploiement : Les modèles plus petits sont bien adaptés aux appareils périphériques et aux applications mobiles, tandis que les modèles plus grands fonctionnent idéalement dans un cloud ou un centre de données.

* Coût : Les grands modèles nécessitent davantage d’infrastructures de calcul pour fonctionner.

Les développeurs devraient également examiner les langues que le modèle d’IA doit prendre en charge, en fonction de la personne qui l’utilisera et de l’endroit où il sera appliqué.

Avec l’importance croissante de l’IA souveraine, de nombreux pays mettent au point des modèles propriétaires formés aux langues et aux ensembles de données locaux. Cela permet aux pays de maintenir le contrôle sur l’IA, en veillant à ce que le développement et l’application s’aligne sur leurs normes culturelles, éthiques et juridiques uniques.

A l’avenir, les développeurs chercheront à construire et à déployer des LLM capables d’améliorer des applications spécifiques à l’industrie, ainsi qu’à travailler sur l’amélioration de l’interopérabilité entre les systèmes, à la réduction des coûts opérationnels et à l’optimisation de l’efficacité. En utilisant des LLM sur-mesure, les entreprises peuvent construire des applications d’IA qui répondent à leurs besoins spécifiques afin d’améliorer la satisfaction des clients et favoriser l’excellence opérationnelle.
_____________________________

Par Nat Ives, directeur commercial Entreprise France chez NVIDIA

 

À lire également :

OpenAI annonce « o3 » : successeur du modèle « o1 » mais plus dangereux ?

IA : Anthropic découvre que les grands LLM peuvent cacher leurs intentions !

Mistral lance la seconde génération de son grand LLM : Mistral Large 2

Les grands chantiers des LLM et de l’IA générative

Le petit Granite 3.1 d’IBM rivalise avec les modèles géants de l’IA

Meta Llama 3.3, avec un peu plus de réflexion à l’intérieur…

Phi-4, le nouveau petit modèle de Microsoft qui raisonne comme un grand

Google Gemini 2.0 : modèle pour l’ère des agents intelligents

Re:Invent 2024 : Amazon dévoile Nova, une nouvelle famille de modèles d’IA multimodaux

Mistral AI lance son premier modèle multimodal et des services gratuits pour séduire les développeurs