La plateforme logicielle open-source de machine learning, construites par des développeurs travaillant pour Google, Cisco, IBM, Red Hat et de nombreuses autres compagnies high-tech, vient d’atteindre un état suffisamment stable et fait donc l’objet d’une numérotation « 1.0 » officielle.
Des entreprises commerciales de renom, US Bank, Chase, GoJek, Amazon Web Services, Bloomberg, Uber, Shopify, GitHub, Canonical, Intel, Alibaba Cloud, TuSimple, Dell, Shell, Arrikto, and Volvo, l’utilisent déjà en production.
Comme le précisent dans un post les co-auteurs du projet, Kubeflow simplifie la vie des ingénieurs spécialisés dans le Machine Learning et des Data Scientists en leur permettant d’exploiter les ressources du Cloud (public comme privé) via Kubernetes, le système d’orchestration des containers devenu incontournable et le véritable pilier universel du cloud hybride.
Véritable Toolkit ML conçu pour Kubernetes, Kubeflow veut rendre les déploiement de workflows de Machine Learning sous Kubernetes aussi simples, portables et scalables que possible.
Kubeflow n’impose pas sa propre plateforme ML mais cherche au contraire à simplifier et fluidifier le déploiement sur n’importe quel cluster Kubernetes des principales plateformes de Machine Learning open source du marché à commencer par TensorFlow (Google) et TensorRT (NVidia) mais aussi très prochainement de PyTorch (Facebook), MXNet, Chainer et d’autres.
Les modèles programmés puis mis en containers sont envoyés comme des ressources à Kubernetes pour être entrainés. Différentes fonctionnalités de KubeFlow Serving ,encore en version alpha, permettent d’exploiter au mieux les serveurs d’inférence et répartir la charge de travail. Parmi les fonctionnalités encore en développement dans cette version, la prise en compte des Metadatas, pour assurer le suivi des datasets, jobs et modèles mais aussi Katib pour affiner les hyperparamètres. Également encore dans l’attente d’une numérotation majeure, la gestion des opérateurs distribués et la prise en compte d’autres framework comme Xgboost.
Alors que de plus en plus d’entreprises se convertissent à Kubernetes, Kubeflow s’annonce comme une brique majeur pour simplifier le déploiement des projets ML au sein des clusters.
Avec cette version 1.0, Kubeflow est bien avancé et son avenir dépend désormais du nombre d’entreprise qui s’y intéresseront, comme le confirme Debo Dutta, ingénieur chez Cisco et contributeur au projet : « Nous aimerions voir la communauté s’étoffer et que plus de personnes et d’entreprises nous rejoignent ». A bon entendeur…