witam

parsuje automatycznie kilka tys. plikow xml w ktorych sa opisy ale
niektore sa jakos dziwnie przekonwertowane

np. wystepuje cos takiego
"skĹ‚ada siÄ™ z części" - składa się z części

  1. mb_detect_encoding('składa się z części');

podaje ze to jest UTF-8 czyli tak samo jak w tych poprawnych plikach

i teraz w jaki sposob mozna to ewentualnie przekonwertowac do jakiejs czytelnej formy
ewentualnie w ogole pominac dany xml w parsowaniu do bazy danych - moze kolejnego
dnia bedzie to juz poprawione i nie ma sie cos z tym wysilac
jak mozna wylapac taki bledny plik?

  1. iconv("utf-8", "iso-8859-2", 'składa się z części')

tak dla przykladu powyzszy od razu strajkuje mi komunikatem

iconv() [function.iconv]: Detected an illegal character in input string

sa na to jakies pomysly?
z gory dzieki wielkie za pomoc i sugestie




edit//
pomaga przekonwertowanie z UTF-8 na windows-1250 ale jak zlapac to czy akuratnie jest dobrze czy zle zakodowane skoro mb_detect_encoding
zarowno w dobrym jak i zlym xml-u wykrywa kodowanie UTF-8??