Créer un assistant vocal open source basé sur Rhasspy

Flavien

il y a 5 mois

Créer un assistant vocal open source basé sur Rhasspy

Pourquoi choisir un assistant vocal open source ?

On a beau aimer les assistants vocaux comme ceux de Google, Amazon ou Apple, ils ont tous un petit défaut majeur : ils écoutent, stockent, analysent… parfois un peu trop. Pour les amateurs de domotique DIY, soucieux de leur vie privée, l’approche open source a clairement un intérêt. Avec un assistant vocal comme Rhasspy, vous gardez le contrôle total des données, tout en personnalisant le système selon vos besoins réels.

Dans cet article, je vous montre pas à pas comment créer votre propre assistant vocal open source, en vous appuyant sur la solution Rhasspy. L’idée ? Un projet 100 % hébergé chez vous, sans cloud, et intégrable à votre domotique existante. Le tout avec du matériel peu coûteux.

Présentation rapide de Rhasspy

Rhasspy (pour Raspberry Home Assistant Speech System) est un projet open source qui transforme votre Raspberry Pi (ou autre mini-PC) en assistant vocal local. Il écoute une phrase d’activation (« Hotword »), la reconnaît, transforme la commande vocale en texte, et l’envoie à un gestionnaire d’automatisation comme Home Assistant, Node-RED ou OpenHAB.

Il fonctionne même hors ligne, grâce à des outils de reconnaissance vocale comme Pocketsphinx, Snowboy, ou Porcupine. Et surtout, tout se passe chez vous. Pas d’envoi de données dans le cloud.

Matériel nécessaire

Pour démarrer avec Rhasspy, nul besoin d’un gros budget. Voici une config simple et efficace que j’ai testée chez moi :

Un Raspberry Pi 3 ou 4 (vous pouvez aussi utiliser d’autres machines Linux)
Une carte microSD (16 Go minimum) avec Raspberry Pi OS installé
Un micro USB ou une carte son avec micro intégré (ReSpeaker, Matrix Voice, etc.)
Un haut-parleur USB ou jack pour le feedback vocal
Connexion réseau (Ethernet ou Wi-Fi)

Si vous avez déjà bricolé un projet domotique, vous avez sûrement tout ça qui traîne dans un tiroir.

Installation de Rhasspy

Rhasspy peut s’installer de plusieurs façons : en mode natif, en utilisant Docker ou en version préconfigurée avec Home Assistant. Ici, je vais vous montrer l’installation via Docker, parce que c’est rapide et propre.

Voici les étapes que j’ai suivies :

Installer Docker sur le Raspberry Pi :

curl -fsSL https://get.docker.com -o get-docker.shsudo sh get-docker.sh

Créer un dossier pour Rhasspy :
```
mkdir -p ~/rhasspy/profiles/fr
```

Lancer le conteneur Docker :

docker run -d -p 12101:12101 \--name rhasspy \--restart unless-stopped \-v "$HOME/rhasspy/profiles:/profiles" \-v "/etc/localtime:/etc/localtime:ro" \rhasspy/rhasspy \--user-profiles /profiles \--profile fr

Ensuite, accédez à l’interface web de Rhasspy sur :

Vous voilà avec un assistant vocal capable d’éteindre une lumière sans connexion internet !

Return d’expérience : ça marche ?

Après quelques semaines de tests chez moi, Rhasspy s’avère surprenant d’efficacité pour une solution 100 % open source. La reconnaissance vocale est respectable même dans un environnement bruité (merci le bon micro). La latence est raisonnable (environ 1 seconde de réaction selon le STT utilisé).

Le plus gros travail, c’est clairement le temps passé à affiner les phrases et slots pour que l’assistant couvre tous les cas d’usage pertinents. C’est un peu du « code vocal », mais une fois le système affuté, c’est ultra plaisant à utiliser. Même madame commence à l’adopter, c’est dire…

Petit bémol à noter : la synthèse vocale avec PicoTTS n’est pas aussi “humaine” que Google ou Alexa. Mais honnêtement, pour des feedbacks simples comme « C’est fait » ou « La lumière est allumée », ça suffit largement.

Améliorations possibles

Voici quelques pistes pour aller plus loin :

Centraliser l’audio : en plaçant plusieurs satellites Rhasspy dans différentes pièces
Intégrer un écran : pour visualiser les commandes ou afficher un statut
Ajouter un bouton physique : pour activer le micro à la demande (utile avec des enfants à la maison)
Entraîner son propre wake word : pour vraiment faire votre propre Jarvis

Pour les plus geeks d’entre vous (on est sur Domogeek.fr après tout 😄), l’association avec Node-RED décuple les possibilités d’automatisation sans trop écrire de code pur.

Pourquoi ça vaut le coup

On n’est peut-être pas encore sur un niveau d’assistant à la Tony Stark, mais Rhasspy permet déjà de récupérer le contrôle complet de la voix dans la maison connectée. Pas d’espionnage à la clé, un haut degré de personnalisation, et la fierté de faire tourner un système 100 % local qui répond à la voix, ça n’a pas de prix.

Et entre nous, c’est carrément plus satisfaisant d’avoir un assistant vocal que vous avez entièrement construit et compris.

Alors, prêt à parler à votre maison… sans passer par la Silicon Valley ?