Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [PHP][MySQL]Dziwne problemy z kodowaniem między stroną a bazą danych
Forum PHP.pl > Forum > Przedszkole
sebap123
Mam dosyć dziwny problem z kodowaniem między stroną, a bazą danych MySQL. W bazie mam zapisane dwa rekordy: nazwa i skrót. Nazwa jest podawana przez użytkownika, a skrót jest generowany automatycznie przez skrypt (pobiera on pierwsze trzy znaki i sprawdza, czy taki skrót istnieje - jeśli tak to dopisuje cyfrę).
Wszystko odbywa się przy pomocy zwykłego formularza. Po wysłaniu i wygenerowaniu skutu pojawia się potwierdzenie zawierające nazwę i wygenerowany skrót. Potem jest to zapisywane do bazy i wyświetlana jest lista zwierająca nazwę i odpowiadający jej skrót.

I tutaj pojawia się mój problem. Nazwa zawsze, jest poprawnie wyświetlana (zawiera polskie znaki), a skrót nie - zawsze ma znak zapytania w rombie zamiast polskich znaków. Sprawdzałem w bazie, i tam zarówno nazwa jak i skrót wpisują się z krzaczkami zamiast polskich liter, ale wszelkie sprawdzenia, porównania itp. dokonywane na bazie zawsze są poprawne. Jak już mówiłem, wyświetlanie nazwy na stronie jest zawsze poprawne - zawsze znaczy i w momencie wyświetlenia potwierdzenia jak i listy, dlatego to co się dzieje w bazie średnio mnie niepokoi bo wynik nazwy mam poprawny.

Parę info dot. mojej strony i środowiska programistycznego, może to kogoś na coś naprowadzi:
- używam systemu szablonów smarty ze zdefiniowanym kodowaniem utf-8
- na wszystkich stronach html jest zdefiniowany meta-tag kodowania utf-8
- pliki tpl są tworzone w notepad++ z kodowaniem utf-8
- piszę w NetBeans, który ma odgórne kodowanie plików utf-8

Tak więc już nie wiem co jest nie tak, z tym skrótem, a przyznaje, że jest to rzecz, która mnie już bardzo irytuje. Może ktoś ma jakiś pomysł, jak ten problem rozwiązać? Jeśli coś jeszcze mam sprawdzić to napiszcie.
YaQzi
To co jest wpisywane z poziomu formularza musi być tak samo zinterpretowane w drugą stronę. Ale skoro przy wysyłaniu z kodu coś nie tak to gdzieś tego utf-8 brakuje... A przy połączeniu z bazą danych masz ustalanie kodowania?

  1. mysql_query("SET NAMES 'utf8'");


Tylko jak będziesz sprawdzał to wrzuć najpierw kilka rekordów bo to ma wpływ też na inserty.
lobopol
A jak skracasz, znając życie używasz substr zamiast mb_substr
morbic
Zaraz po mysql_connect:
  1. mysql_query('SET NAMES utf8');


Odsyłam do tego tematu: Temat: MYSQL Polskie znaki


//Edit: Poprawiony link, dzięki @toaspzoo
toaspzoo
php header
<meta ...

Cytat(morbic @ 17.07.2011, 21:25:38 ) *
Zaraz po mysql_connect:
<!--Geshi:283079:php--><pre class="php-brief" style="font-family:monospace;"><div class="head">[PHP] 110402



Pusto !
sebap123
@lobopol: nie używam żadnej funkcji wbudowanej, tylko traktuje napis jako tabelę znaków.

@YaQzi, @morbic:
Wkleiłem to mysql_query('SET NAMES') zarówno utf8 jak i iso-8859-2 i jak wpisuję utf-8 to wyświetla mi te same krzaczki co mam w bazie - zarówno na nazwie jak i na skrócie, jak wpisałem iso-8859-2 to nazwa jest ok, a skrot tak jak był.

@toaspzoo: sory, ale nie rozumiem o co Ci chodzi.
toaspzoo
Cytat(sebap123 @ 17.07.2011, 21:45:45 ) *
@lobopol: nie używam żadnej funkcji wbudowanej, tylko traktuje napis jako tabelę znaków.

@YaQzi, @morbic:
Wkleiłem to mysql_query('SET NAMES') zarówno utf8 jak i iso-8859-2 i jak wpisuję utf-8 to wyświetla mi te same krzaczki co mam w bazie - zarówno na nazwie jak i na skrócie, jak wpisałem iso-8859-2 to nazwa jest ok, a skrot tak jak był.

@toaspzoo: sory, ale nie rozumiem o co Ci chodzi.


Pozwolę sobie napisać kolorem czerwonym - LINK NIEPRAWIDŁOWY!
YaQzi
Cytat(sebap123 @ 17.07.2011, 21:45:45 ) *
@YaQzi, @morbic:
Wkleiłem to mysql_query('SET NAMES') zarówno utf8 jak i iso-8859-2 i jak wpisuję utf-8 to wyświetla mi te same krzaczki co mam w bazie - zarówno na nazwie jak i na skrócie, jak wpisałem iso-8859-2 to nazwa jest ok, a skrot tak jak był.

Ale jak wstawiłeś 'SET NAMES' to dodałeś nowe rekordy czy sprawdzałeś na starych? Bo na starych będzie Ci cały czas bugować bo masz w dwóch kolumnach różne kodowanie.
toaspzoo
Link morbic'a jest nieprawidłowy wink.gif
lobopol
Cytat(toaspzoo @ 17.07.2011, 21:58:32 ) *
Link morbic'a jest nieprawidłowy wink.gif

Genialnie 4 raz już tego nie pisz.
sebap123
@toaspzoo: dzięki, już to sprawdziłem

@YaQzi: tak dodałem owe rekordy przy utf-8 i nadal to samo, a wręcz gorzej, bo obcina krzaki na wyświetlaniu.
YaQzi
Cytat(toaspzoo @ 17.07.2011, 21:58:32 ) *
Link morbic'a jest nieprawidłowy wink.gif


Zamiast marudzić na 3 posty to być poprawił. tongue.gif Bo id tematu w linku jest.
Link poprawiony.
morbic
A jakie kodowanie ma tabela i pola w niej?
sebap123
Poprawiłem już kodowanie tabeli i bazy przy pomocy instrukcji z tego artykułu o MySQL. Teraz w bazie nie mam już krzaczków, jak i na stronie przy wywołaniu. Jednak cały czas coś jest nie tak, a mianowicie ucina mi trzeci znak jeśli w skrócie pojawia się polski znak, lub pokazuje znak zapytania w rombie ( nie wiem jeszcze do końca od czego to zależy).
W czasie tworzenia skrótu, pierwszy znak przy pomocy funkcji strtolower jest zamieniany na małą literę, jednak jeśli jest to polski znak, to już ta funkcja nie chce go zmienić. Tak więc, niby coś się poprawiło, ale niedużo, bo nadal nie mam tego czego chciałem, tyle tylko, że teraz ładniej mi się wyświetla wszystko w bazie.

Aha, zapomniałem dodać, że jak ręcznie dopiszę polski znak w tabeli to w podglądzie na stronie już się dobrze wyświetla.
thek
A czytałeś, że funkcje stringowe działają kiepsko z polskimi znakami, ponieważ bazują na iso-8859-1, a nie iso-8859-2? Tutaj musisz używać funkcji uniwersalnych dla kodowań wielobajtowych, a więc tych z przedrostkiem mb_ lub zrobić sobie mapowanie przy konwersji.
sebap123
@thek:
No szczerze powiedziawszy, to przeczytałem to w manualu, ale nie do końca nie wiedziałem o co chodzi. Dzięki za info. Rzeczywiście wystarczyło zamienić ta funkcję, plus dokonać paru konwersji i tyle. Wielkie dzięki za to info.


Teraz mam tylko jeszcze jedno pytanie dot. długości napisów. Jak już mówiłem, skrót wykonuję, traktując nazwę, jako tablicę znaków i pobieram trzy pierwsze znaki, a jeśli już taki skrót istnieje dopisuję jeszcze dwa - . i 1. Jeśli nadal istnieje dodaje 1 do ostatniego znaku i tak aż do skutku. Jednak, jeśli w napisie występuje polski znak, to zajmuje on dwie pozycje w tabeli. Czy może ktoś mi poradzić, jak to obejść, żeby można było zrobic tak jak napisałem, również na ciągach z polskimi znakami?
thek
Używaj wciąż funkcji mb_ to będziesz wiedział, bo istnieje także mb_strlen, która zlicza dobrze wyrazy z polskimi znakami, a do cięcia jest mb_substr teraz jedynie file_exist i jazda w stylu
  1. if( mb_strlen( $nazwa_pliku ) > 2 ) { //sprawdzamy czy nazwa pliku ma 3 lub więcej znaków
  2. $skrot = mb_substr( $nazwa_pliku, 0, 3 ); //wycinamy 3 pierwsze
  3. if( !file_exists( $skrot ) ) { //sprawdzamy czy istnieje
  4. for($i = 1; :$i++) { //jesli nie to nieskończona pętla zwiększająca licznik o 1 co przebieg by tworzyć SKR.1, SKR.2, SKR.3
  5. if( !file_exists( $skrot.'.'$i ) ) { //sprawdzamy czy testowany skrót istnieje
  6. $skrot = $skrot.'.'$i; //jeśli nie to wpisujemy go jako znaleziony...
  7. break; //... i wychodzimy z nieskończonej pętli
  8. }
  9. }
  10. }
  11. } else {
  12. //przewidziałeś, że nazwa pliku będzie krótsza niż 3 znaki? :)
  13. }
oczywiście dopasować to musisz sam do swojego skryptu, ja tylkoCi w komentaarzach do kolejnych instrukcji napisałem na co zwrócić uwagę. z pętlą for( $i=1; ;$i++) musisz uważać. Dawno tego nie używałem i powinno działać w nieskończoność aż do instrukcji break, ale nie jestem pewien czy php przyjmował ten zapis z pominięciem czy w końcu sobie odpuścili smile.gif Jeśli sypnie Ci tam błędem to daj dowolny warunek zawsze prawdziwy w miejsce pustki, czyli przykładowo for( $i=1; true; $i++)
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.