Il était déjà possible d’aider en temps réel l’agent d’un centre de contact lorsqu’il répond à un email ou lorsqu’il chatte, en lui apportant des informations ou en lui suggérant des réponses. Cette notion d’agent « augmenté » s’ouvre désormais au média Voix grâce à l’amélioration des performances de la transcription de la voix en texte (speech-to-text) en temps réel.

 

Depuis quelques années, l’analyse de la voix (speech analytics) a bénéficié des progrès de la reconnaissance vocale et de l’analyse linguistique. Pour autant, son usage souffrait de certaines limites. La plupart du temps, il s’agissait d’une analyse en différé sur des milliers de conversations, typiquement afin d’identifier les points qui posent problèmes, comme des questions récurrentes n’ayant pas de réponse dans le self-service. L’analyse en temps réel était possible mais limitée à des cas précis, comme l’alerte d’un superviseur quand certains mots-clés sensibles étaient identifiés durant une conversation entre un agent et un client.

 

En 2020, l’analyse en temps réel de la voix en mode speech-to-text rend possible la notion d’agent « augmenté ». Cette notion était déjà une réalité pour les médias écrits. L’agent augmenté permet aux entreprises de faire passer leur stratégie de service client au niveau supérieur en offrant à chaque conseiller son propre assistant personnel, qui disposera alors des meilleures informations pour répondre aux clients. Ainsi, lorsqu’un agent répond à des emails ou dialogue en Chat, l’outil de service client du CRM peut l’assister en lui poussant des informations issues de la base de connaissance, en lui suggérant des actions, en préremplissant un formulaire ou en alimentant directement la connaissance client, dans le CRM.

 

La voix impose de fortes contraintes de performances

 

Pour transposer cette fonction à la voix, il ne suffisait pas que le taux de reconnaissance dépasse un certain seuil. Il fallait aussi que la latence soit réduite à moins d’une seconde car dans une conversation orale, un délai de plusieurs secondes compliquerait la tâche de l’agent au lieu de l’aider. Or, cette latence dépend à la fois de la vitesse de transcription (speech-to-text), de l’analyse linguistique et du déclenchement d’une action (conseil, article poussé), lui-même lié au délai de réponse de la base de connaissance ou du CRM. Ces performances doivent en outre être obtenues sur l’ensemble des flux vocaux du centre de contact, en mobilisant des ressources dont le coût doit ménager un ROI.

 

Une offre tout juste émergente

 

Pour concrétiser cette notion d’agent augmenté en mode vocal, l’offre se structure.  À titre d’exemples, des projets pilotes sont en cours chez des acteurs comme Allo-Media, Odigo, NewVoiceMedia (racheté par Vonage) ou Nuance. Salesforce a pour sa part embarqué cette notion dans son offre Salesforce Service Cloud Voice, qui sera disponible courant 2020. Quel que soit l’outil tiers qui gèrera le canal Voix dans Salesforce, les flux vocaux pourront ainsi être retranscrits et exploités par l’IA Einstein, qui suggérera en temps réel la « next best action » ou affichera des informations complémentaires sur une offre. Les cas d’usages sont d’ailleurs infinis et nombre d’entre eux restent à inventer.

 

Auteur : Fatiha Zelmat, Customer Success DX / Salesforce