IntlPull
Comparison
8 min read

Screenshot-Kontext mit OCR: Wie IntlPull Lokalise bei visueller Lokalisierung schlägt

Lernen Sie wie IntlPulls selbst-gehostetes Tesseract OCR und Screenshot-Kontext-Feature Übersetzern visuellen Kontext gibt und Ihnen Geld spart.

IntlPull Team
IntlPull Team
03 Feb 2026, 11:44 AM [PST]
On this page
Summary

Lernen Sie wie IntlPulls selbst-gehostetes Tesseract OCR und Screenshot-Kontext-Feature Übersetzern visuellen Kontext gibt und Ihnen Geld spart.

Das Problem: Übersetzer fehlt der Kontext

Eine der größten Herausforderungen bei der Lokalisierung ist Kontext. Übersetzer sehen oft einen String wie "Absenden" ohne zu wissen:

  • Ist es ein Button oder ein Label?
  • Ist es oben oder unten am Bildschirm?
  • Was ist die umgebende UI?
  • Wie viel Platz ist verfügbar?

Ergebnis: Generische Übersetzungen die nicht zur UI passen.


Die Lösung: Screenshot-Kontext

Screenshot-Kontext löst das durch:

  1. Screenshots hochladen Ihrer App oder Website
  2. Übersetzungs-Keys taggen mit Bounding Boxes
  3. Text automatisch erkennen mit OCR

IntlPull vs Lokalise: Der Screenshot-Vergleich

FeatureIntlPullLokalise
Screenshot-UploadIn allen bezahlten Plänen enthaltenBezahltes Add-on
OCR Auto-ErkennungSelbst-gehostetes Tesseract (kostenlos)Cloud-basiert (pro-Request Gebühren)
Batch-UploadJaNein
Fuzzy Key MatchingLevenshtein + SubstringBasis-Matching
API-ZugangVollständige REST APIBegrenzt

Kostenvergleich

Lokalise OCR-Preise:

  • Cloud Vision API Calls: 0,005-0,02$ pro Request
  • Für 1.000 Screenshots mit monatlichem OCR: 60-240$/Jahr allein an OCR-Gebühren

IntlPull OCR-Preise:

  • Selbst-gehostetes Tesseract: 0$ pro Request
  • Keine zusätzlichen Gebühren
  • In allen bezahlten Plänen enthalten

Der Vorteil von selbst-gehostetem OCR

IntlPull nutzt Tesseract OCR, die branchen-standard Open-Source OCR-Engine:

Terminal
1# Tesseract ist auf dem Server installiert
2tesseract --version
3# tesseract 5.3.0
4
5# Keine Cloud-API-Calls
6# Keine Pro-Request-Gebühren
7# Keine Daten verlassen Ihre Infrastruktur

Vorteile:

  • Datenschutz: Screenshot-Daten verlassen nie Ihre Infrastruktur
  • Geschwindigkeit: Keine Netzwerk-Latenz zu Cloud-APIs
  • Kosten: Null Grenzkosten pro OCR-Operation
  • Zuverlässigkeit: Keine Drittanbieter-API-Ausfälle

Wie Auto-Erkennung funktioniert

Schritt 1: Text-Erkennung

Tesseract scannt den Screenshot und extrahiert Textregionen:

JSON
1{
2  "detected_texts": [
3    {
4      "text": "Bestellung absenden",
5      "x": 350,
6      "y": 480,
7      "width": 120,
8      "height": 40,
9      "confidence": 0.95
10    }
11  ]
12}

Schritt 2: Fuzzy Key Matching

Der erkannte Text wird mit Ihren Übersetzungs-Keys abgeglichen:

  1. Exakter Match (Score: 1.0)
  2. Substring Match (Score: 0.9 × Verhältnis)
  3. Levenshtein-Distanz (normalisierte Ähnlichkeit)

Schritt 3: Vorgeschlagene Tags

JSON
1{
2  "suggested_tags": [
3    {
4      "key_id": "abc123",
5      "key_name": "buttons.submit",
6      "x": 350,
7      "y": 480,
8      "confidence": 0.95,
9      "match_score": 1.0
10    }
11  ]
12}

Praxisnaher Workflow

Für Entwickler

Terminal
1# Screenshots aus CI/CD hochladen
2for screenshot in screenshots/*.png; do
3  curl -X POST \
4    -H "X-API-Key: ip_live_xxx" \
5    -F "file=@$screenshot" \
6    -F "tags=v2.5.0,checkout-flow" \
7    https://api.intlpull.com/api/v1/projects/PROJECT_ID/screenshots
8done

Für Übersetzer

Beim Übersetzen von "buttons.submit" sehen sie:

  • Den tatsächlichen Button in der UI
  • Umgebenden Kontext (was davor/danach kommt)
  • Verfügbarer Platz für die Übersetzung
  • Mehrere Screenshots wenn der Key an verschiedenen Stellen erscheint

Performance-Benchmarks

BildgrößeTesseract ZeitGesamt-API-Antwort
< 1MB~500ms~1 Sekunde
1-5MB~1-2 Sekunden~2-3 Sekunden
5-20MB~3-5 Sekunden~5-7 Sekunden

Best Practices

1. Repräsentative Screenshots erfassen

  • Alle States einschließen (leer, ladend, Fehler, Erfolg)
  • Verschiedene Bildschirmgrößen erfassen
  • Versionsnummern in Metadaten taggen

2. Tags zur Organisation nutzen

Terminal
1# Nach Feature-Bereich
2-F "tags=checkout,payment"
3
4# Nach Version
5-F "tags=v2.5.0,sprint-42"
6
7# Nach Plattform
8-F "tags=ios,dark-mode"

3. Passende Confidence-Schwellenwerte

  • 0.9+: Automatisch ohne Review anwenden
  • 0.7-0.9: Vorschlagen aber Bestätigung erfordern
  • <0.7: Nicht vorschlagen (zu unsicher)

Fazit: Warum IntlPull gewinnt

MetrikIntlPullLokalise
OCR-Kosten0€60-240+€/Jahr
DatenschutzOn-PremiseCloud (Drittanbieter)
Setup-KomplexitätVorinstalliertAPI-Key + Billing
Batch-OperationenJaBegrenzt
API-ZugangVollständigTeilweise

Für Teams die:

  • Viele Screenshots verarbeiten
  • Wert auf Datenschutz legen
  • Vorhersagbare Kosten wollen
  • API-Automatisierung brauchen

IntlPulls selbst-gehosteter Tesseract-Ansatz ist der klare Gewinner.

Starten Sie Ihre kostenlose Testversion

Tags
screenshot
ocr
visual-context
lokalise
comparison
translator-tools
2026
IntlPull Team
IntlPull Team
Product

Building tools to help teams ship products globally. Follow us for more insights on localization and i18n.