L’Inria annonce l’ouverture de Software Heritage, une initiative qui a pour objectif de collecter, organiser, préserver, et rendre accessible le code source de tous les logiciels disponibles publiquement. Microsoft apporte son concours à cette initiative montrant ainsi le changement réalisé par l’éditeur depuis l’arrivée de Satya Nadella.

Quels logiciels sont concernés ? Pratiquement tous nos actes quotidiens sont exécutés par des logiciels : échanger des messages avec la famille et les amis, payer des factures, faire des achats, accéder au divertissement, faire des démarches administratives, trouver des informations, ou planifier des voyages…

Mais ce n’est que la partie émergée de l’iceberg : le logiciel contrôle le système embarqué dans nos moyens de transport ou de communication, les échanges commerciaux et financiers. Il est au cœur des équipements et des dispositifs médicaux ; il assure le bon fonctionnement des réseaux de transport et de communication, des banques et des établissements financiers.

Heritage1Un défi sociétal, technique et scientifique

L’Inria dévoile aujourd’hui le projet Software Heritage, dont l’objectif est de construire à la fois une moderne « bibliothèque d’Alexandrie » du logiciel, un référentiel unique du code source et un instrument de recherche pour l’Informatique. Les plateformes permettant le partage de code open source existent déjà mais le problème est qu’elles ne sont pas pérennes. A ce jour, le projet héberge près de 23 millions de projets, 2,7 milliards de ligne code open source représentant un volume de 200 To. Cela représenterait environ 20 % du code open source jamais produit. La structure est dirigée par Roberto Di Cosmo, professeur d’informatique à l’université de Paris Diderot, directeur de l’IRILL, une structure impliquée dans la qualité du code opens source.

Software Heritage s’appuiera sur une infrastructure distribuée, de manière à garantir la robustesse et la disponibilité. Le code est stocké sur un site de l’INRIA et dupliqué sur le cloud Azure de Microsoft.

Software Heritage constitue le socle pour une base de données référençant tous les codes sources des logiciels utilisés dans l’industrie, garantie d’une meilleure gestion du cycle de vie et d’une accessibilité à long terme de la production logicielle industrielle. Lorsqu’il bénéficiera de mises à jour en temps réel, Software Heritage deviendra le catalogue de code de référence pour tous les utilisateurs industriels, permettant ainsi aux développeurs de nouveaux logiciels de trouver, ré-utiliser, et archiver de nouveaux codes source.

Software Heritage aujourd’hui

« Nous avons décidé de lancer Software Heritage il y a plus d’un an, et nous avons montré sa faisabilité commente Antoine Petit, président directeur général d’Inria. Afin de le déployer à l’échelle mondiale, il est temps maintenant d’ouvrir le projet à la contribution la plus large, nationale et internationale ». Deux premiers partenaires internationaux se sont déjà engagés pour soutenir le projet et l’aider à grandir : Microsoft, l’un des plus grands industriels de l’informatique dans le monde, et DANS, une institution publique au service de la préservation de l’information scientifique aux Pays-Bas.

Tous concernés, tous contributeurs

Après avoir lancé le projet, avoir démontré sa faisabilité et avoir établi les premiers partenariats, L’Inria lance un appel mondial à tous les contributeurs à rejoindre cette initiative.

Pour ses promoteurs, Software Heritage est un projet qui nécessite la contribution d’un grand nombre d’acteurs :
– Pour collecter tout le code source disponible : nous aider à identifier les milliers de sites disparates dans lesquels se retrouve aujourd’hui éparpillé le patrimoine logiciel mondial ;
– Pour contribuer au développement : l’équipe de Software Heritage a une longue tradition de collaboration et est bien connue dans le monde du logiciel libre ; dans les prochains jours, nous allons ouvrir notre propre code source au monde entier ;
– La résolution des défis scientifiques posés par la construction d’une archive universelle du code source à partir d’informations dispersées va nécessiter de nouvelles contributions ; la participation des chercheurs de toutes les disciplines sera déterminante pour réussir.
– Préserver sur le long terme et partager à travers le monde le contenu de cette archive nécessite des ressources conséquentes, sur un plan humain, matériel et financier, ainsi que des partenaires internationaux.

Heritage2