Content-Type header declares a wrong charset.
Your scraper must detect the actual encoding and decode the content correctly.
| Declared charset (header) | ascii |
|---|---|
| Actual encoding (body) | utf-8 |
| Scenario | German text with umlauts encoded as UTF-8 but header declares charset=ascii |
Grüße aus München! Schöne Größe an alle Ärzte und Übersetzer.
Straße, Gemütlichkeit, Brötchen — typisch deutsche Wörter.
Die Lösung für das Rätsel ist überraschend einfach.
Köln, Düsseldorf, Würzburg — Städte mit Umlauten.