parsuje automatycznie kilka tys. plikow xml w ktorych sa opisy ale
niektore sa jakos dziwnie przekonwertowane
np. wystepuje cos takiego
"skĹ‚ada siÄ™ z części" - składa się z części
mb_detect_encoding('składa się z części');
podaje ze to jest UTF-8 czyli tak samo jak w tych poprawnych plikach
i teraz w jaki sposob mozna to ewentualnie przekonwertowac do jakiejs czytelnej formy
ewentualnie w ogole pominac dany xml w parsowaniu do bazy danych - moze kolejnego
dnia bedzie to juz poprawione i nie ma sie cos z tym wysilac
jak mozna wylapac taki bledny plik?
iconv("utf-8", "iso-8859-2", 'składa się z części')
tak dla przykladu powyzszy od razu strajkuje mi komunikatem
iconv() [function.iconv]: Detected an illegal character in input string
sa na to jakies pomysly?
z gory dzieki wielkie za pomoc i sugestie
edit//
pomaga przekonwertowanie z UTF-8 na windows-1250 ale jak zlapac to czy akuratnie jest dobrze czy zle zakodowane skoro mb_detect_encoding
zarowno w dobrym jak i zlym xml-u wykrywa kodowanie UTF-8??