Talent Factory Talent Factory
Startseite Produkte Dienstleistungen Über Uns Ressourcen Kontakt

Verba: Die kostenlose Sprachdiktier-Extension für VS Code – jetzt mit Deepgram, Offline-Modus und Claude Code Integration

· von daniel
verba vs-code open-source voice-dictation developer-tools deepgram claude

Verba: Die kostenlose Sprachdiktier-Extension für VS Code

Sprachsteuerung gehört längst zum Alltag. Auf dem Smartphone, im Auto, beim Smart Home. Aber in der Entwicklungsumgebung? Da tippen die meisten noch jedes Wort von Hand. Das muss nicht sein.

Mit Verba gibt es jetzt eine VS Code Extension, die Sprache direkt in deinen Editor bringt. Aufnehmen, transkribieren, aufbereiten, einfügen. Alles in einem Schritt, ohne VS Code zu verlassen.

Warum Sprachdiktieren für Entwickler?

Entwickler schreiben nicht nur Code. Sie schreiben Commit Messages, Dokumentation, Code Reviews, E-Mails, Slack-Nachrichten. All das lässt sich schneller diktieren als tippen. Besonders bei längeren Texten spart Sprachdiktieren nicht nur Zeit, sondern schont auch Handgelenke und Konzentration.

Das Problem: Die bestehenden Tools passen nicht in den Entwickler-Workflow.

Der Markt: Teuer und am Bedarf vorbei

Tools wie Whisper Flow oder SuperWhisper bieten zwar solide Spracherkennung, aber sie sind:

  • Kostenpflichtig mit monatlichen Abonnements
  • Systemweite Tools, die nichts vom Editor-Kontext wissen
  • Nicht in VS Code integriert – der Text landet irgendwo, aber nicht dort, wo du ihn brauchst

Für Entwickler, die ihren gesamten Arbeitstag in Visual Studio Code verbringen, ist das unbefriedigend. Du brauchst ein Tool, das versteht, wo dein Cursor steht, ob du im Editor oder im Terminal arbeitest, und welche Art von Text du gerade brauchst.

Verba: Native VS Code-Integration

Verba ist anders konzipiert. Es ist kein systemweites Diktiertool, das zufällig auch in VS Code funktioniert. Es ist eine native VS Code Extension, gebaut für genau eine Zielgruppe: Entwickler in VS Code.

So funktioniert es

  1. Cmd+Shift+D (Mac) oder Ctrl+Shift+D (Windows/Linux) – ein Quick Pick Menü erscheint
  2. Wähle ein Template (beim ersten Mal; danach wird das letzte Template automatisch wiederverwendet)
  3. Sprich
  4. Gleiche Tastenkombination – Aufnahme stoppt
  5. Das Ergebnis erscheint an deiner Cursor-Position

Das war’s. Kein Fensterwechsel, kein Copy-Paste, kein Nachbearbeiten von Füllwörtern.

Was unter der Haube passiert

Verba nutzt eine Pipeline aus zwei Diensten:

  • Deepgram Nova-3 transkribiert die Audioaufnahme zu Text – schnell und akkurat
  • Anthropic Claude bereinigt und strukturiert den Text anhand des gewählten Templates

Das Template bestimmt, wie Claude den transkribierten Text aufbereitet. Bei einer Commit Message wird der Text zu einer prägnanten, konventionskonformen Nachricht. Bei Freitext werden Füllwörter entfernt und Sätze geglättet. Bei JavaDoc entsteht eine strukturierte Dokumentation.

Die Verarbeitung läuft als Streaming direkt in VS Code – ein Live-Zeichenzähler in der Statusleiste zeigt den Fortschritt. Abbrechen ist jederzeit möglich.

Neue Features im Überblick

Selbstkorrekturen automatisch erkennen (Course Correction)

Wer diktiert, korrigiert sich manchmal mitten im Satz: „Treffen wir uns morgen, nein warte, am Freitag um zehn." Verba erkennt solche Selbstkorrekturen automatisch und gibt nur den finalen Text aus: „Treffen wir uns am Freitag um zehn." Das funktioniert in allen Templates und Sprachen.

Sprachbefehle für Formatierung

Sprich Formatierungsbefehle einfach aus: „neuer Absatz", „Komma", „Aufzählungspunkt" – und sie werden in echte Formatierung umgewandelt. Kein manuelles Nachbearbeiten, kein Unterbrechen des Diktats.

Glossar für projektspezifische Begriffe

Fachbegriffe, Produktnamen, eigene Klassen- und Funktionsnamen: Verba kann sie exakt so transkribieren, wie du es willst. Globale Begriffe kommen in die settings.json, projektspezifische in eine .verba-glossary.json im Projektverzeichnis.

Offline-Transkription mit whisper.cpp

Wer maximale Privatsphäre will oder keine API-Kosten für die Transkription zahlen möchte, kann auf whisper.cpp umschalten. Die Audioaufnahme verlässt den Rechner dann nicht mehr. Einfach whisper.cpp installieren, ein Modell herunterladen, und den Provider in den Einstellungen auf local setzen.

Claude Code Integration

Das neue Claude Code Prompt-Template ist für Entwickler gedacht, die Claude Code nutzen. Verba transkribiert die Sprachaufnahme, reichert sie mit relevantem Codebase-Kontext an (via grepai oder OpenAI Embeddings) und generiert daraus einen optimierten Prompt – bereit zur Ausführung im Terminal.

8 Templates – für jeden Anwendungsfall

Verba liefert 8 vorgefertigte Templates mit:

TemplateEinsatz
FreitextAllgemeines Diktieren, Notizen, Nachrichten
Commit MessageGit Commit Messages nach Konventionen
JavaDocStrukturierte Code-Dokumentation
MarkdownFormatierte Dokumentation
E-MailProfessionelle E-Mail-Texte
Code CommentKommentare direkt im Code
Explain CodeCode-Erklärungen in natürlicher Sprache
Claude Code PromptOptimierte Prompts für Claude Code

Templates lassen sich jederzeit mit Cmd+Alt+T wechseln oder in der settings.json vollständig anpassen und erweitern.

Cross-Platform: macOS, Windows und Linux

Verba läuft überall dort, wo VS Code läuft. Die Audio-Aufnahme nutzt plattformspezifische Backends:

  • macOS: AVFoundation
  • Windows: DirectShow mit automatischer Geräteerkennung
  • Linux: PulseAudio

Auf allen Plattformen kannst du dein Mikrofon frei wählen – entweder über das Quick Pick Menü oder per Setting.

Bring Your Own Key: Keine Abokosten

Verba kostet nichts. Die Extension ist Open Source unter MIT-Lizenz.

Statt eines Abonnements nutzt du deine eigenen API Keys:

  • Deepgram API Key für die Nova-3-Transkription (oder whisper.cpp für Offline-Betrieb)
  • Anthropic API Key für die Claude-Textaufbereitung

Die Keys werden sicher in VS Codes SecretStorage gespeichert – nie im Klartext, nie in einer Config-Datei. Wer lokal transkribiert, braucht nur noch den Anthropic Key.

Was kostet das in der Praxis? Die API-Kosten liegen typischerweise bei wenigen Cent pro Diktat. Verba trackt die Kosten automatisch und zeigt eine Übersicht in einem eingebauten WebView-Panel.

Verba vs. kommerzielle Alternativen

VerbaWhisperFlowSuperWhisper
PreisKostenlos (BYOK)MonatsaboMonatsabo
VS Code-IntegrationNativNeinNein
Transkriptions-EngineDeepgram Nova-3 oder lokalAnbieterAnbieter
Offline-ModusJa (whisper.cpp)NeinNein
Templates8 (konfigurierbar)BegrenztBegrenzt
SelbstkorrekturJaNeinNein
SprachbefehleJaBegrenztBegrenzt
PlattformmacOS, Windows, LinuxmacOSmacOS
Open SourceJa (MIT)NeinNein
DatenkontrolleEigene API KeysAnbieter-ServerAnbieter-Server

Erste Schritte

Voraussetzung ist ffmpeg für die Audioaufnahme. Auf macOS ein brew install ffmpeg, auf Windows über Chocolatey oder direkten Download.

Danach:

  1. Verba im VS Code Marketplace installieren
  2. Cmd+Shift+D drücken
  3. API Keys eingeben (einmalig)
  4. Template wählen – ab dem zweiten Mal startet die Aufnahme sofort

VS Code Marketplace: Verba


Verba wird aktiv weiterentwickelt. Feature Requests und Bug Reports sind willkommen über GitHub Issues.