Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: NAMES / CHARACTER SET
Forum PHP.pl > Forum > Bazy danych > MySQL
zietek
Witam, przesiadam sie z MS SQL na MySQL i dopadaja mnie male problemy...
Kodowanie tabel mam ustawione na 'utf-8'. Nie wiem czemu zapytania SELECT zwracaja dopiero poprawnie dane (do PHP) po zastosowaniu wczesniej:
  1. SET NAMES 'utf-8'

Do czego sluzy zatem NAMES (skoro mam zdefiniowane kodowanie w tabelach) ?
Czy mozna ten parametr ustawic globalnie dla calej bazy aby nie ustawiac go przed kazdym SELECT ? (uwaga: NIE chodzi mi tu o caly serwer bazy)

Drugie pytanie jakis sie nasuwa: jakie roznice w dzialaniu maja dwa ponizsze zapisy ?
  1. SET NAMES 'charset_name'
  2. SET CHARACTER SET charset_name


I jeszcze jeden maly problem z sortowaniem w utf-8.
Zauwazylem ze:
  1. SELECT * FROM tabela ORDER BY pole

w przypadku gdy wyrazy zaczynaja sie np na 's' oraz 'ś' nie sortuje ich w kolejnosci 1) s; 2) ś a uznaje jako s-s i dopiero sortowanie odbywa sie po kolejnej literze...
Da sie temu zaradzic?

Zauwazylem w Query Managar'ze, ze to zapytan typu SELECT dodawane sa czesto na koncu pojedyncze znaki np:
  1. SELECT * FROM tabela ORDER BY pole o

Jaki skutek to odnosi w MySQL?
sticker
jakie masz collation na bazie i na tabeli?
Indeo
Baza może mieć różne kodowania i może w nich poprawnie przechowywać narodowe znaki (o ile ich nie pożera - zamiana na ?). Nie jest oczywiste, że baza danych z kodowaniem A zwraca wyniki w kodowaniu A. Baza może zwracać dane w B (dowolnym kodowaniu) ale musisz ją poinformować o tym inaczej będzie zwracać w domyślnym kodowaniu dla połączeń z bazą danych (lub czasem cholera wie wg czego). Dlatego set names B nawet na bazie z kodowaniem A zwróci wynik w kodowaniu B. Dlatego też w set names żąda się kodowania którego używa się na stronie. Skoro na stronie używasz kodowania utf8 to warto po połączeniu z bazą dać set names utf8, żeby zwracane wyniki były zgodne z kodowaniem strony.
Za odpowiednie traktowanie polskich znaków odpowiada collation . Pola które posiadają polskie znaki powinny mieć polskie collation w ramach danego charset czyli utf8_polish_ci dla utf.
zietek
Dzieki za wyczepujaca odpowiedz:) Zapytam jeszcze czy przy operacjach INSERT, UPDATE tez nalezy przy uzyciu SET NAMES ustawic kodowanie jakie mamy na stronie (kodowanie w jakim wedruja dane do bazy).
Indeo
Dokładnie tak! Znowu - kodowanie które trafia do bazy może być inne niż w bazie (byleby w jakiś sposób potrafiła zapisać polskie znaki) trzeba tylko poinformować bazę czego ma się spodziewać w potoku danych - do tego służy set names. Baza przekonwertuje kodowanie na swoje własne tylko musi wiedzieć z jakim ma do czynienia na wejściu. Sama tego nie odgadnie. Nie zawsze domyślne ustawienia są bezkonfliktowe dlatego warto używać set names. W szczególności kiedy importujesz plik sql w określonym kodowaniu - musisz uprzedzić bazę o tym kodowaniu.
prond
Jeszcze mała wskazówka do sortowania - jeżeli masz np. tabelę, w której trzymasz dane w wielu językach będziesz czasem chciał je przesortować stosując inne metody porównywania napisów. Musisz to niestety robić jawnie w każdym zapytaniu:
  1. SELECT * FROM `pages` ORDER BY name collate utf8_polish_ci;

lub
  1. SELECT * FROM `pages` ORDER BY name collate utf8_czech_ci;


Niestety coś takiego nie wpływa na metodę porównywania napisów przy sortowaniu:
  1. SET NAMES 'charset_name' COLLATE 'collation_name';


Generalnie najwygodniejszy jest utf8, z domyślnie ustawioną metodą porównywania napisów na tę, której będziesz stosował najczęściej,
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.