Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: UTF-8, parsowanie, zapis do XML
Forum PHP.pl > Forum > PHP
metoda
Witam. Posiadam stronę która ma ustawione kodowanie na utf-8. Na tej stronie odpalana jest funkcja, która parsuje inną stronę. Ta inna strona także posiada kodowanie utf-8. Z tej innej strony wyciągam interesujące mnie dane i zapisuję do pliku XML. Przed zapisem, wysietlam te dane poprzez echo na stronie i wszystkie polskie znaki są ok. Niestety przy zapisie do pliku XML są już krzaczki. Gdzie leży problem questionmark.gif
blooregard
A czy masz ustawione kodowanie w pliku XML?
  1. <?xml version="1.0" encoding="UTF-8"?>
metoda
Z tego co wiem to XML ma domyślnie UTF-8 bez deklarowania tego. Oczywiście sprawdziłem teraz deklarując kodowanie na UTF-8, nie pomogło sad.gif

edit:

Ok, wiem gdzie leży błąd. Tak wygląda kawałek kodu:
  1. $input=file_get_contents('file.html');
  2. $div_input=strip_tags($input,'<div></div><span></span>');
  3.  
  4. echo $div_input;//tutaj widać polskie znaki ok
  5.  
  6. $dom=new DOMDocument("1.0", "UTF-8");
  7. $dom->loadHTML($div_input); // tu chyba leży problem
  8. $dom->preserveWhiteSpace=false;
  9. echo $dom->saveXML(); // no i tu mamy krzaki


Czy przypadkiem loadHTML nie koduje domyślnie w ISO questionmark.gif
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.