Les différentes technologies d’intelligence artificielle vont envahir nos vies et les assistants numériques vont nous aider dans nos tâches quotidiennes.
L’article qui suit n’a pas été écrit par une machine mais déjà les robots sont utilisés pour écrire des articles qui s’appuie sur le commentaire de chiffres comme les compte-rendu sportifs ou boursiers. Assez rapidement, de nombreuses tâches pourront être accomplies par ce que l’on appelle désormais un chatbot c’est-à-dire un agent conversationnel qui interagit via le langage naturel avec des humains. Nous aurons accès à des assistants via nos smartphones en contact permanent avec des ressources de toutes sortes disponibles sur le cloud.
Et les capacités de ces robots, programmes ou autres assistants personnes s’améliorent tous les jours. Témoin la récente création de l’équipe de Laboratoire SONY CSL Research basé à Paris créé il y a une vingtaine d’années et dirigé par François Pachet. Pour cette création, l’équipe de Sony a utilisé un logiciel baptisé Flow Machine.
Le morceau intitulé Daddy’s Car a été réalisé en plusieurs étapes. D’abord la sélection d’une base de données de quelque 13 000 musiques de différentes styles (Jazz, Pop music, musique brésilienne, Broadway…) et compositeurs. Le compositeur, en l’occurrence Benoit Carré) sélectionne les styles et génère la mélodie et l’harmonie d’un morceau avec l’aide du logiciel FlowComposer.
Pour le morceau Daddys’s Car, il a choisi le style des Beatles et pour MrShadow une combinaison de grands compositeurs américains qui inclut Cole Porter, Gershwin, Duke Ellignton…). Avec un deuxième système baptisé Rechord, le musicien améliore la création à partir de musiques déjà existantes. Il finit ensuite la production et le mixage pour donner un résultat certes modeste mais qui vaut bien ce que l’on peut entendre sur les ondes. Ce n’est pas la première que des machines créent de la musique mais Sony entend poursuivre ces travaux et entend publier un album entier l’année prochaine.
Un apprentissage permanent
Les assistants numériques que proposent Apple, Amazon ou Microsoft sur les smartphones ou les postes de travail améliorent leur permanence et tire parti de l’interaction avec l’ensemble des utilisateurs. Il y a eu plus de 12 milliards de requêtes faites à Cortana, l’assistante proposée par Microsoft utilisée quotidiennement par 133 millions d’utilisateurs actifs.
L’objectif de Microsoft est de démocratiser l’intelligence artificielle et de l’ouvrir à tous comme en son temps il visait l’installation d’un PC sur chaque bureau et dans chaque foyer. Parmi les autres applications utilisant ces techniques, on peut citer Microsoft Pix, un outil de sélection d’image, MileIQ, une application visant à faciliter les déplacements ou encore Swiftkey, un clavier censé anticipé les mots à venir avant même que l’utilisateur ne les ait tapés. Microsoft a également développé une plateforme Bot (Bot Framework) accessible à tous les développeurs. Depuis la dernière conférence Build, Microsoft fait état de plus de 40 000 développeurs qui ont utilisé ces outils. Uber a utilisé l’API de reconnaissance de l’image pour améliorer la sécurité des passagers.
L’autre voie poursuivi par la firme de Redmond est le développement d’un supercalculateur spécialisé en IA utilisant largement les circuits programmables (FPGA ou Field-Programmable Gate Arrays) et disponible via Azure. Sur des applications spécifiques, Microsoft annonce des performances significatives. Par exemple, la traduction vers l’anglais de la version russe du roman Guerre et Paix (1440 pages) en moins de trois secondes. Le même ensemble de nœuds de circuits FPGA peut traduire la totalité de la bibliothèque du Congrès des Etats-Unis en 76 secondes. Bref, les capacités de ces nouveaux outils n’ont pas fini de nous étonner.