SRT vs VTT vs SBV vs ASS: Kompletter Untertitelformat-Vergleich 2026
Die Wahl des richtigen Untertitelformats kann den Unterschied zwischen nahtloser Wiedergabe und fehlerhaftem Rendering, professionellem Styling und reinem Text, universeller Kompatibilität und Plattform-Lock-in ausmachen. Ob Sie eine Videoplattform erstellen, einen YouTube-Kanal verwalten oder Inhalte an Streaming-Dienste verteilen – das Verständnis der Untertitelformat-Unterschiede ist entscheidend.
Dieser umfassende Leitfaden vergleicht die vier wichtigsten Untertitelformate – SRT, WebVTT, SBV und ASS – und behandelt ihre technischen Spezifikationen, Anwendungsfälle, Kompatibilität und praktische Konvertierungsstrategien. Am Ende wissen Sie genau, welches Format Sie für Ihr Projekt verwenden sollten.
Warum die Wahl des Untertitelformats wichtig ist
Untertitelformate sind nicht nur Container für Text und Zeitcodes – sie bestimmen:
- Wiedergabekompatibilität: Einige Formate funktionieren nur auf bestimmten Plattformen
- Styling-Fähigkeiten: Von reinem Text bis pixelgenauer Positionierung
- Dateigröße: Beeinflusst Ladegeschwindigkeit und Speicherkosten
- Bearbeitungskomplexität: Beeinflusst Workflow-Effizienz
- Barrierefreiheit-Konformität: Gesetzliche Anforderungen in vielen Regionen
Lassen Sie uns in jedes Format eintauchen.
Die vier wichtigsten Untertitelformate
1. SRT (SubRip Subtitle) — Der universelle Standard
Erstellt: 2000
Erweiterung: .srt
Mime-Typ: text/plain oder application/x-subrip
Format-Struktur
SRT11 200:00:01,500 --> 00:00:04,200 3Willkommen zum Untertitelformat-Vergleich. 4 52 600:00:04,300 --> 00:00:07,800 7SRT ist das am weitesten unterstützte Format. 8 93 1000:00:08,000 --> 00:00:11,500 11Es verwendet Komma-Trenner für Millisekunden.
Hauptmerkmale
- Zeitcode-Format:
HH:MM:SS,mmm --> HH:MM:SS,mmm(Komma-Trenner) - Styling: Nur grundlegende HTML-Tags (
<i>,<b>,<u>) - Positionierung: Keine
- Metadaten: Keine
- Kodierung: UTF-8 empfohlen (aber oft mit Legacy-Kodierungen gebrochen)
Vorteile
✅ Universelle Kompatibilität: Funktioniert auf 99% der Videoplayer ✅ Einfache Struktur: Leicht zu parsen und manuell zu bearbeiten ✅ Kleine Dateigröße: Klartext, minimaler Overhead ✅ Menschenlesbar: Kann in jedem Texteditor bearbeitet werden ✅ YouTube/Vimeo native Unterstützung: Direkt ohne Konvertierung hochladen
Nachteile
❌ Kein erweitertes Styling: Kann Schriftart, Farbe oder Position nicht steuern ❌ Keine Metadaten: Keine Sprach-Tags, Untertitel vs. Untertitel-Unterscheidung ❌ Kodierungsprobleme: UTF-8 nicht erzwungen, führt zu defekten Zeichen ❌ Begrenzte Barrierefreiheit: Keine semantischen Tags für Soundeffekte vs. Dialog
Wann SRT verwenden
- Video-Hosting-Plattformen: YouTube, Vimeo, Wistia Standardformat
- Maximale Kompatibilität: Verteilung an unbekannte Player
- Einfacher Inhalt: Keine Styling-Anforderungen über grundlegendes Kursiv/Fett hinaus
- Übersetzungs-Workflows: Einfachstes Format für Übersetzer
2. WebVTT (Web Video Text Tracks) — Der Web-Standard
Erstellt: 2010 (W3C-Standard)
Erweiterung: .vtt
Mime-Typ: text/vtt
Format-Struktur
VTT1WEBVTT 2 3NOTE Dies ist eine WebVTT-Datei mit Styling 4 5STYLE 6::cue { 7 background-color: rgba(0,0,0,0.8); 8 color: white; 9 font-family: sans-serif; 10} 11 1200:00:01.500 --> 00:00:04.200 13Willkommen zum WebVTT-Format. 14 1500:00:04.300 --> 00:00:07.800 16<v Speaker1>WebVTT unterstützt Voice-Tags. 17 1800:00:08.000 --> 00:00:11.500 align:start position:10% 19Es verwendet Punkte für Millisekunden.
Hauptmerkmale
- Zeitcode-Format:
HH:MM:SS.mmm --> HH:MM:SS.mmm(Punkt-Trenner) - Header erforderlich: Muss mit
WEBVTTbeginnen - Styling: Vollständiges CSS über
STYLE-Blöcke und Inline-Cue-Einstellungen - Positionierung: Präzise Kontrolle mit
align:,position:,line:,size: - Metadaten:
NOTE-Blöcke,KIND-Attribut (Untertitel vs. Untertitel) - Voice-Tags:
<v Name>Text</v>für Sprecheridentifikation
Vorteile
✅ W3C-Standard: Native HTML5 <track>-Element-Unterstützung
✅ Erweitertes Styling: Volle CSS-Kontrolle über Erscheinungsbild
✅ Semantische Metadaten: Unterscheiden Sie Untertitel, Beschreibungen
✅ Positionierung: Pixelgenaue Platzierung für Bildschirmtext
✅ Barrierefreiheit: Beste Unterstützung für Screenreader und Barrierefreiheit-Features
Nachteile
❌ Nicht universal: Ältere Videoplayer unterstützen es nicht ❌ Komplexer: Erfordert Verständnis von Cue-Einstellungen ❌ Größere Dateigröße: Styling-Blöcke fügen Overhead hinzu ❌ YouTube-Konvertierung: YouTube konvertiert VTT intern zu SRT
Wann WebVTT verwenden
- HTML5-Videoplayer: Moderne Webanwendungen
- Barrierefreiheit-Konformität: Gesetzliche Anforderungen (ADA, WCAG 2.1)
- Benutzerdefiniertes Styling: Markenspezifische Untertitel-Erscheinung
- Mehrere Spuren: Untertitel, Beschreibungen in einer Datei
- Live-Streaming: HLS- und DASH-Protokolle verwenden VTT
3. SBV (SubViewer) — Das YouTube-Format
Erstellt: 2005 (von YouTube 2010 übernommen)
Erweiterung: .sbv
Mime-Typ: text/plain
Format-Struktur
SBV10:00:01.500,0:00:04.200 2Willkommen zum SBV-Format. 3 40:00:04.300,0:00:07.800 5Dies ist YouTubes bevorzugtes Format. 6 70:00:08.000,0:00:11.500 8Beachten Sie das einzeilige Zeitcode-Format.
Hauptmerkmale
- Zeitcode-Format:
H:MM:SS.mmm,H:MM:SS.mmm(keine führenden Nullen bei Stunden) - Keine Sequenznummern: Nur Zeitcode und Text
- Einzeilige Zeitcodes: Start und Ende in einer Zeile, durch Komma getrennt
- Kein Styling: Nicht einmal grundlegende HTML-Tags
- Minimale Struktur: Leerzeilen trennen Untertitelblöcke
Vorteile
✅ YouTube nativ: Schnellstes Upload/Processing auf YouTube ✅ Einfachstes Format: Noch einfacher als SRT zu parsen ✅ Kleine Dateigröße: Minimaler Overhead ✅ Keine Nummerierungsfehler: Sequenznummern können nicht durcheinander geraten
Nachteile
❌ Nur YouTube: Begrenzte Plattform-Unterstützung ❌ Kein Styling: Nicht einmal Kursiv oder Fett ❌ Keine Metadaten: Kann Sprache oder Typ nicht angeben ❌ Stunden-Mehrdeutigkeit: Führende Null optional (inkonsistentes Parsing)
Wann SBV verwenden
- YouTube-Inhalte: Wenn Sie ausschließlich auf YouTube hochladen
- Automatisch generierte Untertitel: YouTubes API gibt SBV-Format zurück
- Maximale Einfachheit: Wenn Sie die geringste Komplexität wünschen
4. ASS/SSA (Advanced SubStation Alpha) — Der Anime-Standard
Erstellt: 1998 (SSA), 2001 (ASS erweiterte Version)
Erweiterung: .ass oder .ssa
Mime-Typ: text/x-ass
Format-Struktur
ASS1[Script Info] 2Title: Meine Anime-Untertitel 3ScriptType: v4.00+ 4Collisions: Normal 5PlayDepth: 0 6 7[V4+ Styles] 8Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding 9Style: Default,Arial,20,&H00FFFFFF,&H000088EF,&H00000000,&H80000000,-1,0,0,0,100,100,0,0,1,2,0,2,10,10,10,1 10 11[Events] 12Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text 13Dialogue: 0,0:00:01.50,0:00:04.20,Default,,0,0,0,,Willkommen zum ASS-Format! 14Dialogue: 0,0:00:04.30,0:00:07.80,Default,,0,0,0,,{\\c&H00FFFF&}Dieser Text ist cyan! 15Dialogue: 0,0:00:08.00,0:00:11.50,Default,,0,0,0,,{\\pos(640,500)}Genau an diesen Koordinaten positioniert.
Hauptmerkmale
- Zeitcode-Format:
H:MM:SS.cc(Zentisekunden, nicht Millisekunden!) - Style-Definitionen: Umfassendes Styling-System mit benannten Styles
- Override-Tags: Inline
{\\tag}für Pro-Wort-Styling - Positionierung: Pixelgenau
\\pos(x,y),\\move(x1,y1,x2,y2) - Effekte: Karaoke-Timing (
\\k), Animationen, Rotationen - Ebenen: Mehrere Untertitel-Ebenen für Overlays
Vorteile
✅ Maximale Kontrolle: Pixelgenaues Styling und Positionierung ✅ Animations-Unterstützung: Bewegung, Fades, Karaoke-Effekte ✅ Professionelle Qualität: Verwendet in Broadcast-Anime und Fansubs ✅ Komplexe Formatierung: Mehrere Schriftarten/Farben in einem Untertitel ✅ Wiederverwendbare Styles: Einmal definieren, auf alle Untertitel anwenden
Nachteile
❌ Komplexität: Steile Lernkurve, nicht handbearbeitbar ❌ Begrenzte Kompatibilität: Hauptsächlich VLC, MPC-HC, mpv, Plex ❌ Große Dateigröße: Style-Definitionen fügen erheblichen Overhead hinzu ❌ Web-inkompatibel: Keine Browser-Unterstützung, erfordert Konvertierung ❌ Übertrieben: 99% der Anwendungsfälle benötigen diese Power nicht
Wann ASS verwenden
- Anime-Fansubs: Industriestandard für Fan-Übersetzungen
- Karaoke-Videos: Timing-Effekte für Mitsing-Videos
- Professionelle Produktion: Broadcast-Qualität Styling-Anforderungen
- Künstlerische Untertitel: Kreative Positionierung und Effekte
- Video-Overlay-Grafiken: Schilder, Bildschirmtext-Übersetzung
Format-Vergleichstabelle
| Feature | SRT | WebVTT | SBV | ASS |
|---|---|---|---|---|
| Zeitcode-Trenner | Komma (,) | Punkt (.) | Punkt (.) | Punkt (.) |
| Zeitcode-Präzision | Millisekunden | Millisekunden | Millisekunden | Zentisekunden |
| Stunden-Format | Immer 2 Ziffern | Immer 2 Ziffern | Variabel | Variabel |
| Sequenznummern | Erforderlich | Optional | Keine | Keine |
| Basis-Styling | HTML-Tags | HTML + CSS | Keine | Volle Kontrolle |
| Positionierung | Keine | Cue-Einstellungen | Keine | Pixelgenau |
| Metadaten | Keine | NOTE-Blöcke | Keine | Script Info |
| Voice-Tags | Manuell (Bindestriche) | <v> Tags | Keine | Name-Feld |
| Dateigröße (1000 Zeilen) | ~50 KB | ~80 KB | ~45 KB | ~150 KB |
| Handbearbeitbar | ✅ Einfach | ⚠️ Moderat | ✅ Einfach | ❌ Schwierig |
| YouTube-Unterstützung | ✅ Ja | ✅ Konvertiert | ✅ Nativ | ❌ Nein |
| Vimeo-Unterstützung | ✅ Ja | ✅ Ja | ❌ Nein | ❌ Nein |
HTML5 <track> | ⚠️ Begrenzt | ✅ Voll | ❌ Nein | ❌ Nein |
| VLC-Player | ✅ Ja | ✅ Ja | ✅ Ja | ✅ Ja |
| Barrierefreiheit | ⚠️ Basis | ✅ Ausgezeichnet | ❌ Schlecht | ⚠️ Moderat |
| Browser-Unterstützung | ⚠️ Via Parsing | ✅ Nativ | ❌ Nein | ❌ Nein |
| Lernkurve | Einfach | Moderat | Einfach | Schwierig |
| Am besten für | Universal | Web/A11y | YouTube | Anime/Pro |
Entscheidungsbaum: Wann welches Format verwenden
START: Was ist Ihr Anwendungsfall?
│
├─ Auf YouTube hochladen?
│ ├─ Nur YouTube? → SBV
│ └─ Multi-Plattform? → SRT
│
├─ Web-Anwendung erstellen?
│ ├─ Barrierefreiheit-Konformität benötigt? → WebVTT
│ ├─ Benutzerdefiniertes Styling benötigt? → WebVTT
│ └─ Nur grundlegende Wiedergabe? → SRT
│
├─ Anime-Fansubbing oder Karaoke?
│ └─ → ASS
│
├─ Maximale Kompatibilität (unbekannte Player)?
│ └─ → SRT
│
├─ Professionelle Übertragung?
│ ├─ Web-Auslieferung? → WebVTT
│ ├─ Styled-Auslieferung? → ASS
│ └─ Universelle Auslieferung? → SRT
│
└─ Übersetzungs-Workflow?
└─ → SRT (am einfachsten für Übersetzer)
Wie man zwischen Formaten konvertiert
Methode 1: Online-Konverter (IntlPull)
Verwenden Sie IntlPulls kostenlosen Untertitelkonverter:
- Laden Sie Ihre Untertiteldatei hoch (beliebiges Format)
- Wählen Sie Zielformat
- Laden Sie konvertierte Datei herunter
Was erhalten bleibt:
- Zeitcodes (automatisch für Format-Unterschiede angepasst)
- Textinhalt
- Basis-Styling (wenn Zielformat es unterstützt)
Was verloren geht:
- Erweitertes Styling bei Konvertierung zu einfacheren Formaten (ASS → SRT verliert Farben/Positionierung)
- Metadaten (Notizen, Script-Info)
Methode 2: Kommandozeile (FFmpeg)
FFmpeg unterstützt alle vier Formate:
Terminal1# SRT zu WebVTT 2ffmpeg -i input.srt output.vtt 3 4# WebVTT zu SRT 5ffmpeg -i input.vtt output.srt 6 7# SRT zu ASS (mit Standard-Styling) 8ffmpeg -i input.srt output.ass 9 10# ASS zu SRT (verliert alle Styles) 11ffmpeg -i input.ass output.srt 12 13# SBV zu SRT 14ffmpeg -i input.sbv output.srt
Profi-Tipp: Bei Konvertierung von ASS zu SRT/VTT entfernt FFmpeg alle Styles. Um einige Formatierungen zu erhalten, passen Sie vor der Konvertierung manuell an.
Fazit
Für 90% der Anwendungsfälle: Beginnen Sie mit SRT für maximale Kompatibilität und Übersetzerfreundlichkeit. Konvertieren Sie zu WebVTT, wenn Sie Web-native Features oder Barrierefreiheit-Konformität benötigen. Verwenden Sie ASS nur, wenn Sie professionelles Styling benötigen oder in der Anime-Community arbeiten. SBV lohnt sich nur bei ausschließlicher Nutzung von YouTube.
Schnellreferenz:
- Universelle Kompatibilität → SRT
- Web-Anwendungen → WebVTT
- Nur YouTube → SBV
- Kreatives Styling → ASS
Kostenlos konvertieren bei IntlPull Untertitelkonverter.
Verwandte Tools:
- SRT-Untertitel-Übersetzungsleitfaden
- Untertitel aus Audio mit Whisper AI generieren
- Kostenloser Untertitelformat-Konverter
Für Teams, die Untertitel-Workflows im großen Maßstab verwalten, erkunden Sie IntlPulls TMS-Plattform mit Übersetzungsspeicher, Multi-Format-Unterstützung und automatisierten Konvertierungen.
