Bad Encoding Scenario

Select scenario:
Cyrillic German Mixed CP1252 Latin-1 Invalid UTF-8
Enable iframe (mixed encoding)
Challenge: The HTTP Content-Type header declares a wrong charset. Your scraper must detect the actual encoding and decode the content correctly.
Declared charset (header)ascii
Actual encoding (body)utf-8
ScenarioGerman text with umlauts encoded as UTF-8 but header declares charset=ascii

German Content

Grüße aus München! Schöne Größe an alle Ärzte und Übersetzer.

Straße, Gemütlichkeit, Brötchen — typisch deutsche Wörter.

Die Lösung für das Rätsel ist überraschend einfach.

Köln, Düsseldorf, Würzburg — Städte mit Umlauten.


All scenarios | Home