TypeWhisper pour macOS : dictée et transcription à l’aide de modèles d’IA locaux

Vous connaissez déjà peut-être MacWhisper pour transcrire en local des fichiers audio en texte avec OpenAI en ligne, et bien TypeWhisper pour macOS s’adresse à tous ceux qui tapent beaucoup, prennent des notes ou dictent des fichiers audio et surtout préfèrent effectuer toutes ces tâches directement sur leur Mac plutôt que de passer par des outils en ligne. L’application est open source sous licence GPL v3, écrite en Swift et fonctionne en binaire universel aussi bien sur les puces Apple (M1, M2, M3, M4…) que sur ancien Mac Intel.

Le principe de TypeWhisper est simple : la parole est convertie en texte, soit entièrement en local à l’aide de différents modèles, soit via des API cloud telles que Groq et OpenAI. Ceux qui utilisent des moteurs locaux conservent les données vocales sur leur propre Mac. Ceux qui préfèrent plus de rapidité peuvent intégrer Groq Whisper, OpenAI Whisper ou d’autres API compatibles OpenAI.

TypeWhisper intègre plusieurs moteurs de transcription :

  • WhisperKit couvre plus de 99 langues, peut diffuser en continu et traduire directement.
  • Parakeet TDT v3 cible 25 langues européennes et fonctionne très rapidement.
  • Apple SpeechAnalyzer fonctionne à partir de macOS 26 et ne nécessite aucun téléchargement de modèle, selon le développeur.
  • À cela s’ajoutent Qwen3 ASR et Voxtral basés sur MLX, tous deux en local, ainsi que les variantes cloud déjà mentionnées : Groq Whisper, OpenAI Whisper et des points de terminaison génériques compatibles OpenAI.

L’audio peut être traité non seulement en direct, mais aussi sous forme de fichier, y compris la transcription par lots via glisser-déposer. Les enregistrements finis peuvent être exportés au format SRT ou WebVTT avec des repères temporels.

Pour un usage quotidien, la fonction de dictée à l’échelle du système est très intéressante. Un raccourci clavier global active le mode Push-to-talk et le texte s’affiche directement à l’endroit où se trouve le curseur. Une simple touche de modification, comme Commande ou Option, peut également servir de raccourci clavier. L’application fournit des retours sonores pour le début de l’enregistrement, la transcription réussie et les erreurs. De plus, le microphone souhaité peut être sélectionné avec un aperçu en direct. Les utilisateurs de WhisperKit voient un aperçu en temps réel de la transcription pendant qu’ils parlent.

Au-delà de la transcription, il existe un niveau dédié au traitement de texte par IA. Les transcriptions ou tout autre texte peuvent être traités par un LLM via une invite. Huit préréglages sont disponibles, allant de la traduction à la correction grammaticale, en passant par la formalisation, le résumé, la rédaction d’e-mails, les listes, le raccourcissement et l’explication. À cela s’ajoute une palette de commandes indépendante, qui peut être affichée sous forme de panneau flottant via un raccourci clavier global, sans qu’il soit nécessaire de dicter au préalable.

Les transcriptions sont enregistrées dans un historique consultable. Celui-ci propose l’édition en ligne, la détection des corrections, des informations contextuelles sur l’application, le regroupement par heure, des filtres, la sélection multiple, l’exportation et des règles de conservation automatiques. L’historique peut être affiché dans une fenêtre séparée, accessible via l’icône de la barre d’état dans la barre de menu.

L’application démarre sur un tableau de bord d’accueil avec des statistiques d’utilisation, un graphique d’activité et une petite introduction. Les mises à jour s’effectuent via Sparkle, au choix entre des versions stables, des versions candidates ou des builds quotidiens. Il existe des widgets de bureau pour les statistiques d’utilisation, la dernière transcription, l’activité et l’historique. L’interface est disponible en anglais et en allemand, et TypeWhisper peut se lancer automatiquement à la connexion. Si cela vous intéresse, n’hésitez pas à vous renseigner ou à essayer l’application si vous recherchez des alternatives à Whisper, Spokenly, Handy, FluidVoice et autres.

Partager
Thématiques: open source

Les articles récents

Test de l’outil de diagnostic OBD2 XTool Anyscan A30M

Après avoir testé le système de diagnostic XTool D8S qui est imposant et robuste, place…

25 mai 2026

Pourquoi les sous-volumes Btrfs sont-ils meilleurs que les partitions Linux traditionnelles ?

Que sont les sous-volumes Btrfs sous Linux ? Découvrez comment ils fonctionnent et pourquoi ils…

25 mai 2026

AltStore Classic permet d’installer des applications sur iPhone sans ordinateur

Oui, vous avez bien entendu la nouvelle version d'AltStore Classic (en version bêta 2.3b1 pour…

24 mai 2026

Saracroche : l’application française gratuite pour bloquer tous les appels frauduleux

Les appels commerciaux non sollicités et les appels indésirables sont une nuisance quotidienne pour des…

19 mai 2026

Comment effacer un disque en toute sécurité sous macOS Tahoe et Sequoia

Effacer un disque en toute sécurité sous macOS Tahoe et Sequoia lorsque l'Utilitaire de disque…

13 mai 2026

Numérisez vos cartes de fidélité avec WalletWallet, simple et gratuit

Si vous préférez garder vos poches vides et vous débarrasser des cartes de fidélité physiques…

7 mai 2026

Ce site web utilise des cookies.