Content-Type header declares a wrong charset.
Your scraper must detect the actual encoding and decode the content correctly.
| Declared charset (header) | latin-1 |
|---|---|
| Actual encoding (body) | utf-8 |
| Scenario | Russian text encoded as UTF-8 but header declares charset=latin-1 |
Привет мир! Это тестовая страница с кириллицей.
Москва — столица России.
Борщ, пельмени, блины — традиционные русские блюда.
Достоевский написал «Преступление и наказание» в 1866 году.
This iframe is served as ISO-8859-1 bytes with header charset=utf-8 — a different mismatch than the main page.