La maison obéit à la voix

La culture du leadership chez soi: la reconnaissance vocale par le biais de «Smart Speakers» a déclenché un boom mondial de la domotique. Sauf en Suisse. Les fabricants hésitent.

La voix la plus connue du monde n’a pas de corps: «Alexa» n’est rien de plus que l’interface acoustique du système de domotique «Echo» d’Amazon. «Siri» est l’équivalent d’Apple. Quant à la version de Google, elle répond certes également avec la voix d’une jeune fille, mais elle utilise la désignation sobre d’«assistant» au lieu d’un nom. Ces trois technologies ont de nombreux clones: selon des analystes de marché, il y aurait dans le monde jusqu’à 100 millions d’appareils dans nos maisons, capables d’obéir à la parole.

Sous la forme de cylindres discrets, de petits écrans ou de cailloux gris en peluche, ces «Smart Speakers» captent les ordres de leur maître, les transmettent au centre de calcul, reçoivent une réponse et effectuent l’action demandée au sein du réseau domestique. Par exemple, sur l’ordre «OK Google, ferme la porte du garage», le garage se ferme. Si on demande: «Alexa, qu’est-ce qui est inscrit sur ma liste de courses?», alors les produits de la liste qui ont été inscrits également par commande vocale quelques jours auparavant sont énoncés à voix haute par le biais des haut-parleurs d’Amazon.

Alexa possède quelque 4000 «compétences»

Serons-nous bientôt les maîtres indétrônables de la maison, dont la voix sera écoutée par chaque machine et chaque appareil? Pas encore tout à fait. Et ce pour plusieurs raisons. La principale, étant que les Smart Speakers ne peuvent transmettre les instructions identifiées qu’aux appareils configurés pour la commande à distance. De plus en plus d’appareils ménagers livrés avec une connexion au réseau sans fil de la maison en font partie.

Pour ces systèmes, les fabricants peuvent, grâce à la structure modulaire correspondante d’Amazon et de Google, écrire des petits programmes qui sont téléchargés sur les Smart Speakers, ce qui leur permet de commander des appareils tiers. Pour le système Echo d’Amazon, il existe déjà, en allemand, près de 4000 «skills» («compétences»), appelées «actions» dans le système Google et disponibles en très petit nombre en allemand. Pour le HomeKit d’Apple avec le Smart Speaker HomePod, il existe encore moins de programmes d’assistance: contrairement aux deux autres systèmes, Apple met en effet à disposition le système de développement pour les programmes d’interfaces non pas à tous les partenaires contractuels mais seulement à ceux qui ont été explicitement acceptés.

Les Smart Speakers ont donc devant eux la perspective d’une ascension fulgurante: jusqu’en 2020, les analystes s’attendent à 200 millions d’appareils dans les maisons au niveau mondial. Cette évolution s’explique par le fait que les systèmes fonctionnent de mieux en mieux. Car avec un nombre croissant d’utilisateurs, ils apprennent plus et deviennent encore plus performants: le «Machine Learning», l’une de variantes de la science de l’intelligence artificielle, repose sur des quantités gigantesques de données catégorisables dont se nourrit le programme et qui lui permettent d’acquérir des caractéristiques distinctives. Les volumes de données nécessaires ne sont toutefois disponibles que depuis quelques années – ce qui a permis de réaliser cette percée. Cela a été possible grâce à une interaction avec un autre développement: le Cloud-Computing ou informatique en nuage. Car pour être précis, ce n’est pas le haut-parleur qui reconnaît ce que vous lui dictez comme message texte. Ce sont les processeurs haute performance qui le font dans un centre de calcul très éloigné de Google, Amazon ou Apple: par connexion en ligne, le Speaker envoie l’enregistrement audio là où, grâce à une énorme performance de calcul, il est déterminé que vous n’avez pas dit «Tu as vu un ballet» mais «Tu as reçu un paquet.»

Google, Amazon et Cie nous écoutent-ils?

Toutefois, il est clair que l’on sait ce que l’on fait entrer à la maison, à savoir un microphone qui permet théoriquement à Google, Amazon & Cie d’espionner en permanence. Certes, les Speakers ne s’allument activement que s’ils entendent le mot code «Alexa» ou «Ok, Google». Mais ils écoutent toujours. Par exemple, quand une chaîne de restauration rapide américaine a fait dire dans un spot publicitaire à la télévision: «OK Google, qu’est-ce qu’un Whopper?», le Smart Speaker a alors lu la définition de la marque Hamburger de Wikipedia dans de nombreux foyers.

En Suisse, on rencontre rarement Alexa et Cie sous la forme de Smart Speaker. Cette réserve est certes due en partie à l’importance accordée à la protection des données, mais seulement dans une moindre mesure. Cela s’explique plus par le fait que les fabricants de Smart Speakers n’ont pas encore lancé officiellement leurs systèmes en Suisse.

Et la cause pourrait être que les Suisses ne s’expriment pas que dans une seule langue mais dans quatre – et dans près de deux douzaines de dialectes rien qu’en allemand. Le risque que le Speaker paraisse idiot si on s’adresse à lui en «français fédéral» ou en dialecte d’Obwald est trop grand. Toutefois, cet obstacle sera bientôt surmonté. Ainsi, l’application de télécommande de la box TV de Swisscom comprend soi-disant aussi bien le dialecte des Grisons que celui du Valais.

Peter Bergmann