Nouveau monde. Pourquoi les assistants vocaux ont besoin d’écoutes humaines

--'--
--'--
Copié dans le presse-papier !

Amazon, Google, Microsoft ou encore Apple ont avoué cet été que des opérateurs humains étaient amenés à écouter des enregistrements de conversations privées recueillies par leurs assistants vocaux.

William Simonin dirige la startup française Vivoka, spécialisée dans la reconnaissance vocale. Il explique pourquoi l’intervention humaine reste nécessaire pour améliorer l’intelligence artificielle même si cela soulève des craintes en matière de vie privée.

franceinfo : Faut-il se méfier des assistants vocaux ?

William Simonin : je n’irai pas jusqu’à dire qu’il faut s’en méfier mais il faut bien comprendre comment ça marche. La reconnaissance vocale fait appel à un "moteur" logiciel appelé Speech To Text (STT), qui convertit la parole en texte écrit. Cette technologie d’intelligence artificielle n’est pas parfaite et c’est la raison pour laquelle les marques font appel à des opérateurs humains afin de corriger les erreurs et d’améliorer l’IA pour qu’elle ne commette pas plusieurs fois les mêmes erreurs.

Cependant, là où il faut se méfier, ou au moins se renseigner, c’est lorsqu’il s’agit d’entreprise ayant un modèle économique axé sur la donnée, ce qui est typiquement le cas de Google. Dans ce cas, il faut que l’utilisateur soit informé et puisse donner son accord pour une exploitation commerciale de ses données.

Comment fonctionne votre assistant vocal ?

Chez Vivoka, nous développons uniquement des assistants vocaux sur mesure pour les entreprises. C’est une approche totalement différente de celle des GAFA, qui est d’essayer de créer l’intelligence artificielle générique la plus puissante au monde. En ce qui nous concerne, nous créons des IA spécifiques, adaptées aux besoins de nos clients. Parfois, nous utilisons le cloud mais pas forcément.

Un assistant vocal non connecté est-il moins performant ?

Un assistant vocal non connecté à Internet risque de se heurter à certaines limites en termes d’évolution mais il n’est pas forcément moins performant. Par exemple, un assistant vocal dans une voiture n’a pas besoin de connexion. En revanche, c’est vrai, il s’agit souvent de systèmes par mots-clés avec une sémantique beaucoup plus réduite.

Vous êtes à nouveau en ligne