Le Voice Lab, association qui œuvre pour la constitution d’un corpus vocal français, et Datafunding, une plateforme de financement sorte de Kickstarter de la donnée, lancent conjointement une campagne dont l’objectif est de récolter les données vocales de nos concitoyens pour aider la recherche et les entreprises nationales.
L’objectif de l’opération est de collecter environ 2 000 heures de données vocales qui seront mises à disposition de l’ensemble de l’écosystème numérique de la voix et de l’innovation en France, en Europe et dans le monde francophone.
Une fois récoltées les données sont anonymisées et normalisées pour contribuer aux corpus et créer des modèles de transcription indépendants et contributifs.
Pour les volontaires qui souhaitent participer à cette collecte, l’inscription s’effectue au travers d’un site web dédié qui permet très simplement de donner son consentement au Voice Lab afin que celui-ci puisse récupérer les données vocales auprès des éditeurs des assistants vocaux. Cet outil permet de gérer les consentements et de les révoquer automatiquement, si l’utilisateur décide d’arrêter sa contribution au Voice Lab.
Karel Bourgois, président du Voice Lab, explique que « le Message que nous souhaitons transmettre aux utilisateurs de Google Home, Alexa ou Siri est l’appel suivant : les données de votre assistant vocal vous appartiennent. Faites-en don à la recherche française ! »
La mission du Voice Lab est de créer une alternative aux solutions et aux modèles économiques existants, afin de garantir d’un côté le respect de la vie privée des utilisateurs et de l’autre de prévenir une dépendance économique aux GAFA et BATX sur les interfaces vocales qui seront les interfaces du futur.
Pour Karel Bourgois, « de plus en plus de personnes souhaitent bénéficier d’appareils avec lesquels elles peuvent réellement communiquer naturellement. Pour développer de tels systèmes il est nécessaire d’accéder à des données vocales libres. C’est pourquoi nous lançons une campagne de data funding citoyen dans le respect des données personnelles. Chaque participant est invité à partager les données vocales stockées chez les GAFAM dans une marketplace française ! Celles-ci permettront à l’écosystème vocal français de développer des technologies souveraines indépendantes des géants du numérique que sont les GAFAM et BATX. Cet acte citoyen permettra de soutenir l’écosystème vocal français et le développement d’une technologie vocale diverse, dynamique et souveraine. »