Filters Clear all
Pricing
Free tier
API
Platform

Transkription 10

KI-gestützte Transkriptionstools wandeln gesprochene Audio- und Videoinhalte in Text um – für Meeting-Protokolle, Podcast-Untertitel, Barrierefreiheit und Forschung. In dieser Kategorie finden sich 76 Tools, die sich in Genauigkeit, Sprachunterstützung und Spezialisierung deutlich unterscheiden.

AssemblyAI

Transkription

Speech-to-Text-API mit Transkription, Zusammenfassung und Audioanalyse

Free From $0.15 55 · 59,024 votes

Jammable

Transkription

Musik-Cover mit KI-Stimmmodellen erstellen

Free 42 · 43,722 votes

AI Slides to Videos

Transkription

Präsentationen in Videos umwandeln

Free 38 · 64,781 votes

Add Subtitle.ai

Transkription

Untertitel in über 100 Sprachen mit KI hinzufügen

Free 37 · 53,896 votes

intellisay

Transkription

Inhalte schnell in verschiedenen Formaten erstellen

Free 37 · 48,867 votes

Altered

Transkription

Stimme in Aufnahmen per KI-Stimmmodellierung ersetzen

Paid 37 · 30,192 votes

VoiceLine

Transkription

Sprachnotizen für Vertriebsteams erfassen und auswerten

Paid 37 · 33,371 votes

VoiceCheap

Transkription

Videos in 30+ Sprachen übersetzen und synchronisieren

Paid 34 · 6,651 votes

Shamaze

Transkription

KI erstellt personalisierte Gutenachtgeschichten in der Stimme der Eltern

Free 31 · 44,642 votes

Create Personalised voice message from Santa

Transkription

Individuelle Sprachnachrichten vom Weihnachtsmann für Kinder

Paid 30 · 22,165 votes

Die Genauigkeit ist das wichtigste Unterscheidungsmerkmal – sie variiert je nach Sprache, Akzent, Audioqualität und Fachvokabular. Allgemeine Transkriptionstools wie WhisperClip und Whisper Notes basieren auf Open Source Whisper-Modellen und unterstützen ein breites Sprachspektrum, während spezialisierte Tools auf bestimmte Bereiche wie Medizin, Recht oder Broadcast-Medien ausgerichtet sind. Apptek etwa zielt auf Unternehmens- und Broadcast-Workflows ab. Bei der Auswahl sollten folgende Fragen im Vordergrund stehen: Unterstützt das Tool die eigene Sprache und den Akzent zuverlässig? Können mehrere Sprecher unterschieden werden? Lässt sich die Ausgabe vor dem Export direkt im Interface bearbeiten? Für Live- oder nahezu live stattfindende Anwendungen spielt die Bearbeitungszeit eine wichtige Rolle. Preismodelle reichen von Minuten-basierter Abrechnung bis hin zu monatlichen Minutenkontingenten – kalkulieren Sie anhand Ihrer tatsächlichen Aufnahmedauer, nicht anhand der Funktionsliste.