Diese Tools wandeln gesprochene Sprache in geschriebenen Text um. Das ist besonders nützlich für die Dokumentation sowie das Verschriftlichen von Meetings, Vorträgen oder – unter der Voraussetzung, dass die datenschutzrechtlichen Voraussetzungen erfüllt sind – auch von anonymisierten Gesprächsanteilen zur Analyse.
Wichtiger Hinweis zum Datenschutz:
Wie bei allen KI-Tools gilt auch hier: Geben Sie niemals sensible personenbezogene Daten von Klient*innen in externe Transkriptionstools ein, es sei denn, Sie haben eine klare datenschutzrechtliche Grundlage und eine explizite Einwilligung hierfür. Nutzen Sie diese Tools für allgemeine, anonymisierte Inhalte oder Ihre persönliche Arbeitsorganisation.
DeepL (Übersetzer mit Spracheingabe)
Was es kann: Obwohl DeepL primär ein Übersetzungsdienst ist, bietet die Web-Oberfläche die Möglichkeit, Sprache einzugeben. Diese wird dann in Text umgewandelt und bei Bedarf direkt übersetzt. Sie können es also nutzen, um Ihre Sprache in Text umzuwandeln und diesen direkt zu kopieren. Es ist für kurze Passagen oder einzelne Sätze gut geeignet.
Sprache: Exzellente Erkennung für Deutsch und andere unterstützte Sprachen.
Kosten: Die Sprach-zu-Text-Funktion ist in der kostenlosen Web-Version verfügbar.
Anwendungsbeispiele: Schnelle Umwandlung gesprochener Worte in Text für E-Mails oder Nachrichten, wenn Sie gerade keine Hand frei haben.
Zugang: Über die DeepL-Webseite (Wählen sie dazu das Mikrofon-Symbol nach Auswahl der Sprachoptionen, sollte diese nicht sichtbar sein, drücken sie Windostaste + H um die Windows-
interne Diktierfunktion zu starten. Stellen Sie sicher, dass sie zuvor in das DeepL Textfeld geklickt haben).
Otter.ai
Was es kann: Otter.ai ist ein spezialisiertes Transkriptionstool, das für die Umwandlung von längeren Audioaufnahmen (z. B. Meetings, Interviews oder Vorlesungen) in Text konzipiert wurde. Es erkennt Sprecher*innen und gliedert den Text in Absätze. Ebenso bietet es auch Funktionen zur Zusammenfassung von Transkripten. Es ist ein leistungsfähiges Tool für die professionelle Transkription.
Sprache: Otter.ai ist primär auf Englisch optimiert, die Qualität der deutschen Transkriptionen ist aber oft auch gut, wenn auch nicht immer perfekt.
Kosten: Es gibt eine kostenlose Basisversion mit einem begrenzten Transkriptionskontingent pro Monat. Für mehr Minuten und erweiterte Funktionen sind kostenpflichtige Pläne verfügbar.
Anwendungsbeispiele:
- Verschriftlichung von internen Teambesprechungen (nicht klient*innenbezogen),
- Transkription von allgemeinen Vorträgen oder Webinaren für interne Schulungszwecke,
- Umwandlung von Memos oder Notizen in Textform.
Zugang: Über die Otter.ai-Webseite.
Google Bard (mittlerweile Teil von Google Gemini)
Was es kann: Auch wenn Google Gemini (ehemals Bard) primär ein Textgenerator ist, bietet es auch Funktionen zur Spracherkennung. Sie können direkt ins Eingabefeld sprechen und Gemini wandelt Ihre Sprache in Text um. Diesen können Sie dann weiterbearbeiten oder als Grundlage für die Texterstellung nutzen. Dies ist eher für kurze Diktate oder die Umwandlung von Ideen gedacht und weniger für die Transkription langer Audioaufnahmen.
Sprache: Es werden viele Sprachen unterstützt, darunter Deutsch mit guter Genauigkeit.
Kosten: Die grundlegende Sprach-zu-Text-Funktion ist in der kostenfreien Version von Gemini enthalten.
Anwendungsbeispiele: Sie können schnelle Notizen diktieren, kurze Ideen festhalten, Entwürfe für E-Mails oder Dokumente sprechen, anstatt sie zu tippen.
Zugang: Direkt über die Google Gemini-Webseite (Zugriff über das Mikrofon-Symbol im Eingabefeld).
Weitere KI-Tools für Sprach-zu-Text-Verarbeitung und Transkription
Sonix: Sicheres, mehrsprachiges Transkriptions-Tool für professionelle Anforderungen.
Amberscript: Präzise deutschsprachige Transkriptionen für Besprechungen, Videos und Interviews.
Trint: Kombiniert automatische Transkription mit komfortablen Editierfunktionen.