Das Problem: Übersetzer fehlt der Kontext
Eine der größten Herausforderungen bei der Lokalisierung ist Kontext. Übersetzer sehen oft einen String wie "Absenden" ohne zu wissen:
- Ist es ein Button oder ein Label?
- Ist es oben oder unten am Bildschirm?
- Was ist die umgebende UI?
- Wie viel Platz ist verfügbar?
Ergebnis: Generische Übersetzungen die nicht zur UI passen.
Die Lösung: Screenshot-Kontext
Screenshot-Kontext löst das durch:
- Screenshots hochladen Ihrer App oder Website
- Übersetzungs-Keys taggen mit Bounding Boxes
- Text automatisch erkennen mit OCR
IntlPull vs Lokalise: Der Screenshot-Vergleich
| Feature | IntlPull | Lokalise |
|---|---|---|
| Screenshot-Upload | In allen bezahlten Plänen enthalten | Bezahltes Add-on |
| OCR Auto-Erkennung | Selbst-gehostetes Tesseract (kostenlos) | Cloud-basiert (pro-Request Gebühren) |
| Batch-Upload | Ja | Nein |
| Fuzzy Key Matching | Levenshtein + Substring | Basis-Matching |
| API-Zugang | Vollständige REST API | Begrenzt |
Kostenvergleich
Lokalise OCR-Preise:
- Cloud Vision API Calls: 0,005-0,02$ pro Request
- Für 1.000 Screenshots mit monatlichem OCR: 60-240$/Jahr allein an OCR-Gebühren
IntlPull OCR-Preise:
- Selbst-gehostetes Tesseract: 0$ pro Request
- Keine zusätzlichen Gebühren
- In allen bezahlten Plänen enthalten
Der Vorteil von selbst-gehostetem OCR
IntlPull nutzt Tesseract OCR, die branchen-standard Open-Source OCR-Engine:
Terminal1# Tesseract ist auf dem Server installiert 2tesseract --version 3# tesseract 5.3.0 4 5# Keine Cloud-API-Calls 6# Keine Pro-Request-Gebühren 7# Keine Daten verlassen Ihre Infrastruktur
Vorteile:
- Datenschutz: Screenshot-Daten verlassen nie Ihre Infrastruktur
- Geschwindigkeit: Keine Netzwerk-Latenz zu Cloud-APIs
- Kosten: Null Grenzkosten pro OCR-Operation
- Zuverlässigkeit: Keine Drittanbieter-API-Ausfälle
Wie Auto-Erkennung funktioniert
Schritt 1: Text-Erkennung
Tesseract scannt den Screenshot und extrahiert Textregionen:
JSON1{ 2 "detected_texts": [ 3 { 4 "text": "Bestellung absenden", 5 "x": 350, 6 "y": 480, 7 "width": 120, 8 "height": 40, 9 "confidence": 0.95 10 } 11 ] 12}
Schritt 2: Fuzzy Key Matching
Der erkannte Text wird mit Ihren Übersetzungs-Keys abgeglichen:
- Exakter Match (Score: 1.0)
- Substring Match (Score: 0.9 × Verhältnis)
- Levenshtein-Distanz (normalisierte Ähnlichkeit)
Schritt 3: Vorgeschlagene Tags
JSON1{ 2 "suggested_tags": [ 3 { 4 "key_id": "abc123", 5 "key_name": "buttons.submit", 6 "x": 350, 7 "y": 480, 8 "confidence": 0.95, 9 "match_score": 1.0 10 } 11 ] 12}
Praxisnaher Workflow
Für Entwickler
Terminal1# Screenshots aus CI/CD hochladen 2for screenshot in screenshots/*.png; do 3 curl -X POST \ 4 -H "X-API-Key: ip_live_xxx" \ 5 -F "file=@$screenshot" \ 6 -F "tags=v2.5.0,checkout-flow" \ 7 https://api.intlpull.com/api/v1/projects/PROJECT_ID/screenshots 8done
Für Übersetzer
Beim Übersetzen von "buttons.submit" sehen sie:
- Den tatsächlichen Button in der UI
- Umgebenden Kontext (was davor/danach kommt)
- Verfügbarer Platz für die Übersetzung
- Mehrere Screenshots wenn der Key an verschiedenen Stellen erscheint
Performance-Benchmarks
| Bildgröße | Tesseract Zeit | Gesamt-API-Antwort |
|---|---|---|
| < 1MB | ~500ms | ~1 Sekunde |
| 1-5MB | ~1-2 Sekunden | ~2-3 Sekunden |
| 5-20MB | ~3-5 Sekunden | ~5-7 Sekunden |
Best Practices
1. Repräsentative Screenshots erfassen
- Alle States einschließen (leer, ladend, Fehler, Erfolg)
- Verschiedene Bildschirmgrößen erfassen
- Versionsnummern in Metadaten taggen
2. Tags zur Organisation nutzen
Terminal1# Nach Feature-Bereich 2-F "tags=checkout,payment" 3 4# Nach Version 5-F "tags=v2.5.0,sprint-42" 6 7# Nach Plattform 8-F "tags=ios,dark-mode"
3. Passende Confidence-Schwellenwerte
- 0.9+: Automatisch ohne Review anwenden
- 0.7-0.9: Vorschlagen aber Bestätigung erfordern
- <0.7: Nicht vorschlagen (zu unsicher)
Fazit: Warum IntlPull gewinnt
| Metrik | IntlPull | Lokalise |
|---|---|---|
| OCR-Kosten | 0€ | 60-240+€/Jahr |
| Datenschutz | On-Premise | Cloud (Drittanbieter) |
| Setup-Komplexität | Vorinstalliert | API-Key + Billing |
| Batch-Operationen | Ja | Begrenzt |
| API-Zugang | Vollständig | Teilweise |
Für Teams die:
- Viele Screenshots verarbeiten
- Wert auf Datenschutz legen
- Vorhersagbare Kosten wollen
- API-Automatisierung brauchen
IntlPulls selbst-gehosteter Tesseract-Ansatz ist der klare Gewinner.
