Verba: Die kostenlose Sprachdiktier-Extension für VS Code
Sprachsteuerung gehört längst zum Alltag. Auf dem Smartphone, im Auto, beim Smart Home. Aber in der Entwicklungsumgebung? Da tippen die meisten noch jedes Wort von Hand. Das muss nicht sein.
Mit Verba gibt es jetzt eine VS Code Extension, die Sprache direkt in deinen Editor bringt. Aufnehmen, transkribieren, aufbereiten, einfügen. Alles in einem Schritt, ohne VS Code zu verlassen.
Warum Sprachdiktieren für Entwickler?
Entwickler schreiben nicht nur Code. Sie schreiben Commit Messages, Dokumentation, Code Reviews, E-Mails, Slack-Nachrichten. All das lässt sich schneller diktieren als tippen. Besonders bei längeren Texten spart Sprachdiktieren nicht nur Zeit, sondern schont auch Handgelenke und Konzentration.
Das Problem: Die bestehenden Tools passen nicht in den Entwickler-Workflow.
Der Markt: Teuer und am Bedarf vorbei
Tools wie Whisper Flow oder SuperWhisper bieten zwar solide Spracherkennung, aber sie sind:
- Kostenpflichtig mit monatlichen Abonnements
- Systemweite Tools, die nichts vom Editor-Kontext wissen
- Nicht in VS Code integriert – der Text landet irgendwo, aber nicht dort, wo du ihn brauchst
Für Entwickler, die ihren gesamten Arbeitstag in Visual Studio Code verbringen, ist das unbefriedigend. Du brauchst ein Tool, das versteht, wo dein Cursor steht, ob du im Editor oder im Terminal arbeitest, und welche Art von Text du gerade brauchst.
Verba: Native VS Code-Integration
Verba ist anders konzipiert. Es ist kein systemweites Diktiertool, das zufällig auch in VS Code funktioniert. Es ist eine native VS Code Extension, gebaut für genau eine Zielgruppe: Entwickler in VS Code.
So funktioniert es
Cmd+Shift+D(Mac) oderCtrl+Shift+D(Windows/Linux) – ein Quick Pick Menü erscheint- Wähle ein Template (beim ersten Mal; danach wird das letzte Template automatisch wiederverwendet)
- Sprich
- Gleiche Tastenkombination – Aufnahme stoppt
- Das Ergebnis erscheint an deiner Cursor-Position
Das war’s. Kein Fensterwechsel, kein Copy-Paste, kein Nachbearbeiten von Füllwörtern.
Was unter der Haube passiert
Verba nutzt eine Pipeline aus zwei Diensten:
- Deepgram Nova-3 transkribiert die Audioaufnahme zu Text – schnell und akkurat
- Anthropic Claude bereinigt und strukturiert den Text anhand des gewählten Templates
Das Template bestimmt, wie Claude den transkribierten Text aufbereitet. Bei einer Commit Message wird der Text zu einer prägnanten, konventionskonformen Nachricht. Bei Freitext werden Füllwörter entfernt und Sätze geglättet. Bei JavaDoc entsteht eine strukturierte Dokumentation.
Die Verarbeitung läuft als Streaming direkt in VS Code – ein Live-Zeichenzähler in der Statusleiste zeigt den Fortschritt. Abbrechen ist jederzeit möglich.
Neue Features im Überblick
Selbstkorrekturen automatisch erkennen (Course Correction)
Wer diktiert, korrigiert sich manchmal mitten im Satz: „Treffen wir uns morgen, nein warte, am Freitag um zehn." Verba erkennt solche Selbstkorrekturen automatisch und gibt nur den finalen Text aus: „Treffen wir uns am Freitag um zehn." Das funktioniert in allen Templates und Sprachen.
Sprachbefehle für Formatierung
Sprich Formatierungsbefehle einfach aus: „neuer Absatz", „Komma", „Aufzählungspunkt" – und sie werden in echte Formatierung umgewandelt. Kein manuelles Nachbearbeiten, kein Unterbrechen des Diktats.
Glossar für projektspezifische Begriffe
Fachbegriffe, Produktnamen, eigene Klassen- und Funktionsnamen: Verba kann sie exakt so transkribieren, wie du es willst. Globale Begriffe kommen in die settings.json, projektspezifische in eine .verba-glossary.json im Projektverzeichnis.
Offline-Transkription mit whisper.cpp
Wer maximale Privatsphäre will oder keine API-Kosten für die Transkription zahlen möchte, kann auf whisper.cpp umschalten. Die Audioaufnahme verlässt den Rechner dann nicht mehr. Einfach whisper.cpp installieren, ein Modell herunterladen, und den Provider in den Einstellungen auf local setzen.
Claude Code Integration
Das neue Claude Code Prompt-Template ist für Entwickler gedacht, die Claude Code nutzen. Verba transkribiert die Sprachaufnahme, reichert sie mit relevantem Codebase-Kontext an (via grepai oder OpenAI Embeddings) und generiert daraus einen optimierten Prompt – bereit zur Ausführung im Terminal.
8 Templates – für jeden Anwendungsfall
Verba liefert 8 vorgefertigte Templates mit:
| Template | Einsatz |
|---|---|
| Freitext | Allgemeines Diktieren, Notizen, Nachrichten |
| Commit Message | Git Commit Messages nach Konventionen |
| JavaDoc | Strukturierte Code-Dokumentation |
| Markdown | Formatierte Dokumentation |
| Professionelle E-Mail-Texte | |
| Code Comment | Kommentare direkt im Code |
| Explain Code | Code-Erklärungen in natürlicher Sprache |
| Claude Code Prompt | Optimierte Prompts für Claude Code |
Templates lassen sich jederzeit mit Cmd+Alt+T wechseln oder in der settings.json vollständig anpassen und erweitern.
Cross-Platform: macOS, Windows und Linux
Verba läuft überall dort, wo VS Code läuft. Die Audio-Aufnahme nutzt plattformspezifische Backends:
- macOS: AVFoundation
- Windows: DirectShow mit automatischer Geräteerkennung
- Linux: PulseAudio
Auf allen Plattformen kannst du dein Mikrofon frei wählen – entweder über das Quick Pick Menü oder per Setting.
Bring Your Own Key: Keine Abokosten
Verba kostet nichts. Die Extension ist Open Source unter MIT-Lizenz.
Statt eines Abonnements nutzt du deine eigenen API Keys:
- Deepgram API Key für die Nova-3-Transkription (oder whisper.cpp für Offline-Betrieb)
- Anthropic API Key für die Claude-Textaufbereitung
Die Keys werden sicher in VS Codes SecretStorage gespeichert – nie im Klartext, nie in einer Config-Datei. Wer lokal transkribiert, braucht nur noch den Anthropic Key.
Was kostet das in der Praxis? Die API-Kosten liegen typischerweise bei wenigen Cent pro Diktat. Verba trackt die Kosten automatisch und zeigt eine Übersicht in einem eingebauten WebView-Panel.
Verba vs. kommerzielle Alternativen
| Verba | WhisperFlow | SuperWhisper | |
|---|---|---|---|
| Preis | Kostenlos (BYOK) | Monatsabo | Monatsabo |
| VS Code-Integration | Nativ | Nein | Nein |
| Transkriptions-Engine | Deepgram Nova-3 oder lokal | Anbieter | Anbieter |
| Offline-Modus | Ja (whisper.cpp) | Nein | Nein |
| Templates | 8 (konfigurierbar) | Begrenzt | Begrenzt |
| Selbstkorrektur | Ja | Nein | Nein |
| Sprachbefehle | Ja | Begrenzt | Begrenzt |
| Plattform | macOS, Windows, Linux | macOS | macOS |
| Open Source | Ja (MIT) | Nein | Nein |
| Datenkontrolle | Eigene API Keys | Anbieter-Server | Anbieter-Server |
Erste Schritte
Voraussetzung ist ffmpeg für die Audioaufnahme. Auf macOS ein brew install ffmpeg, auf Windows über Chocolatey oder direkten Download.
Danach:
- Verba im VS Code Marketplace installieren
Cmd+Shift+Ddrücken- API Keys eingeben (einmalig)
- Template wählen – ab dem zweiten Mal startet die Aufnahme sofort
VS Code Marketplace: Verba
Verba wird aktiv weiterentwickelt. Feature Requests und Bug Reports sind willkommen über GitHub Issues.