Faire de la Deep Research sans supercalculateur : c’est le pari relevé par LightOn avec Reason-ModernColBERT, modèle agile et open source qui bouscule les géants du retrieval. Taillé pour le on-premise, il redonne la main aux DSI et aux infrastructures « on-prem » et « edge ».

LightOn dévoile Reason-ModernColBERT, un modèle open source taillé pour la Deep Research et capable de battre des géants du retrieval avec seulement 150 millions de paramètres. De quoi offrir aux DSI et aux RSSI un moteur de recherche agentique sûr, ultra-rapide et prêt à tourner on-premise.

Fondée à Paris en 2016, LightOn s’est imposée comme la première société européenne de GenAI cotée sur Euronext Growth. Sa plateforme Paradigm aide déjà banques, industriels ou administrations à déployer des IA à grande échelle tout en gardant la maîtrise de leurs données, un atout clé pour les directions des systèmes d’information et de la sécurité .

Avec Reason-ModernColBERT, l’éditeur franchit une nouvelle étape : ce modèle « multi-vecteurs » de « seulement » 150 Millions de paramètres apporte au « search d’entreprise » les capacités de raisonnement que les LLM ont popularisées, mais sans les lourdes contraintes de calcul.

Conçu pour les architectures RAG agentiques, il cible les cas où une requête doit réellement penser – croiser, relier, déduire – avant de répondre, bref exactement ce que les leaders américains de l’IA ont nommé la Deep Research .

Malgré sa compacité, Reason-ModernColBERT surclasse des modèles allant jusqu’à 7 milliards de paramètres sur le benchmark BRIGHT et devance même ReasonIR-8B de 2,5 points NDCG@10 sur les questions Stack Exchange .

Autre argument pour les DSI : grâce à la bibliothèque interne PyLate, l’entraînement complet ne prend que deux heures et moins de 100 lignes de code, ouvrant la voie à un fine-tuning rapide sur des corpus privés .

« Cet investissement nous permet aujourd’hui de débloquer des performances révolutionnaires dans la recherche d’information nécessitant du raisonnement, avec une simplicité remarquable », souligne l’équipe R&D de LightOn .
De fait, l’architecture d’interaction tardive choisie par l’éditeur montre un avantage constant face aux approches denses traditionnelles, tout en restant suffisamment légère pour s’exécuter en local, un point décisif pour les RSSI et DSI soucieux de souveraineté et de confidentialité.

Fidèle à sa feuille de route open source, LightOn publie le modèle, le code d’entraînement et les jeux de données afférents. Reason-ModernColBERT est déjà disponible sur Hugging Face, accompagné d’exemples PyLate pour faciliter son déploiement et son optimisation . Les équipes data peuvent ainsi tester le moteur sur leurs bases de connaissances internes, tandis que les chercheurs disposent d’un terrain de jeu pour explorer de nouvelles stratégies de retrieval raisonné.

En rendant la Deep Research accessible et souveraine, LightOn espère placer Reason-ModernColBERT au cœur des futures plateformes RAG de l’entreprise. La balle est désormais dans le camp des intégrateurs et des équipes innovation pour transformer cette avancée en cas d’usage concrets.

 

À lire également :

LightOn adapte sa plateforme Paradigm à l’ère agentique

« Nous ne sommes pas dans la course aux plus gros modèles »

LightOn lance une API pour sa plateforme IA « Paradigm »

Mistral lance un nouveau modèle Medium 3 et Le Chat en version Entreprise

Mistral Small 3.1 : petit, multimodal, multilingue, il fait de l’ombre aux géants