Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Wielojęzykowość
Forum PHP.pl > Forum > Bazy danych > PostgreSQL
fryk
Witam,

Zabieram się do stworzenia wielojęzykowej aplikacji.

Pytanie: czy w postgres obsługuje kodowanie UTF-8? Czy trzeba to jakoś "obchodzić"?
SongoQ
http://www.sai.msu.su/~megera/postgres/utf8.html

Moze to Ci pomoze.
fryk
Czy ktoś na tym forum zrealizowł w całości jakiś wielojęzykowy projekt?

Czy to się robi tak: UNICODE i wrzucać w odpowiednim kodowani i tyle?
shima
Cytat(fryk @ 2004-12-02 19:43:45)
Czy ktoś na tym forum zrealizowł w całości jakiś wielojęzykowy projekt?

Czy to się robi tak: UNICODE i wrzucać w odpowiednim kodowani i tyle?

Nie używam postgresqla, ale to chyba nie ma znaczenia. Nie wiem jak w utf-ie uzyskać chińskie znaczki, ale chyba nie będziesz używał chińskiego? Z włoskimi znakami sobie poradziłem.
fryk
Cytat(shima)
Nie używam postgresqla, ale to chyba nie ma znaczenia. Nie wiem jak w utf-ie uzyskać chińskie znaczki, ale chyba nie będziesz używał chińskiego? Z włoskimi znakami sobie poradziłem.


Czy i na które pytanie to jest odpowiedź?

Czy to nie jest tak, że każdy tekst (w tym chiński) można przekodować do UTF8 przy insertowaniu i odwrotnie - z UTF8 na źródłowy przy wyciąganiu?
SongoQ
A co powiedziecie na system tlumaczen oprogramowania napisany w php ktory umozliwia tlumaczenie z angielskiego na japonski?
DeyV
1. ja robiłem wielojęzyczny projekt
2. UTF-8 pozwala na wyświetlanie znaków w większości języków świata.
Oznacza to, że nie jest konieczna ani potrzebna jakakolwiek konwersja znaków.
Jeśli ktoś ma zainstalowaną np. klawiaturę z cyrylicą i obsługę tego języka w systemie, to po wklepaniu w jakimś formularzu na stronie w UTF-8 tekstu w cyrylicy, wystarczy go zapisać, i w dowolnej chwili można wyświetlić ten tekst, nawet mieszając obok siebie zestawy znaków różnego typu (czyli nic nie stoi na przeszkodzie, by obok siebie wyświetlić cyrylicę, japoński i np. .. polski) (o ile oczywiście w przegląarce użytkownik będzie miał zainstalowany odpowiedni zestaw znaków...)
shima
Cytat(fryk @ 2004-12-02 20:50:36)
Czy i na które pytanie to jest odpowiedź?

W zasadzie mogę napisać odpowiedź jak dla mojego 6-letniego siostrzeńca:

1. Unicode został stworzony w celu rozwiązania problemów z przekodowywaniem/łączeniem danych o różnym kodowaniu, więc obsługuje. Znane mi systemy bazodanowe obsługują utf, więc sądzę, że postgresql również. Jeżeli nie, to nie zasługuje na uwagę.
2. Uwaga o włoskich znakach diakrytycznych dotyczyła wielojęzykowej strony: polski, angielski, niemiecki, włoski.

Wybacz moje założenie, że jesteś inteligentny i wiesz co nieco nt. postgresql-a, którego jak mniemam używasz.

Pozdrawiam

PS. Wycofuję się z twierdzenia, że to tłumaczenie dla mojego siostrzeńca, mógłby się obrazić. Mój siostrzeniec oczywiście.
fryk
@DeyV: dzięki za rzeczową odpowiedź.

@shima: nie tylko my (bardzo inteligentni i toporni) czytamy to forum - czyta wiele ludzi, którym o wiele łatwiej jest wpaść na blok rzeczowej informacji, niż czytać wątek od początku. Przemyśl to Panie WIELKI, INTELIGENTY PROGRAMISTO I ZNAWCO BAZ DANYCH o "wysokiej" kulturze osobistej.

Pozdrawiam!
SongoQ
@shima Troszeczke za ostro "pojechales". Kazdy sie uczy i kazdy ma jaka tam mniejsza lub wieksza wiedze.

Jesli chodzi o pytania zadawane na tym forum to szczerze mowic troszeczke lamerstwo.
Od czego sa dokumentacje, rozumiem jakies pytania typu: jak jest lepiej cos zrobic, jak optymalniej, inne rozwiazanie, itd.

Podam przyklad z Postgresa ktory padl niedawno na tym forum "Co to jest left join"
Wydaje mi sie ze raczej to forum nie do tego sluzy zeby kogos uczyc teorii podstaw lecz rozwiazywania problemow dotyczacych baz danych, php.
akubiczek
SongoQ: no racja panie, racja

Co do UTFa, to w zasadzie baza nie musi wspierać tego standardu aby móc przechowywać w niej teksty zapisane w tym standardzie. Oczywiście problemy zaczną się w momencie wyszukiwania, porównywania i innych operacjach na tym tekście.

...

..a wystarczyło zajrzeć do dokumentacji:

Supported Character Sets
SQL_ASCII ASCII
EUC_JP Japanese EUC
EUC_CN Chinese EUC
EUC_KR Korean EUC
JOHAB Korean EUC (Hangle base)
EUC_TW Taiwan EUC
UNICODE Unicode (UTF-8)
MULE_INTERNAL Mule internal code
LATIN1 ISO 8859-1/ECMA 94 (Latin alphabet no.1)
LATIN2 ISO 8859-2/ECMA 94 (Latin alphabet no.2)
LATIN3 ISO 8859-3/ECMA 94 (Latin alphabet no.3)
LATIN4 ISO 8859-4/ECMA 94 (Latin alphabet no.4)
LATIN5 ISO 8859-9/ECMA 128 (Latin alphabet no.5)
LATIN6 ISO 8859-10/ECMA 144 (Latin alphabet no.6)
LATIN7 ISO 8859-13 (Latin alphabet no.7)
LATIN8 ISO 8859-14 (Latin alphabet no.8)
LATIN9 ISO 8859-15 (Latin alphabet no.9)
LATIN10 ISO 8859-16/ASRO SR 14111 (Latin alphabet no.10)
ISO_8859_5 ISO 8859-5/ECMA 113 (Latin/Cyrillic)
ISO_8859_6 ISO 8859-6/ECMA 114 (Latin/Arabic)
ISO_8859_7 ISO 8859-7/ECMA 118 (Latin/Greek)
ISO_8859_8 ISO 8859-8/ECMA 121 (Latin/Hebrew)
KOI8 KOI8-R(U)
ALT Windows CP866
WIN874 Windows CP874 (Thai)
WIN1250 Windows CP1250
WIN Windows CP1251
WIN1256 Windows CP1256 (Arabic)
TCVN TCVN-5712/Windows CP1258 (Vietnamese)
fryk
Cytat(akubiczek @ 2004-12-03 18:24:54)
..a wystarczyło zajrzeć do dokumentacji:

Supported Character Sets
SQL_ASCII ASCII
EUC_JP Japanese EUC
EUC_CN Chinese EUC
EUC_KR Korean EUC
JOHAB Korean EUC (Hangle base)
EUC_TW Taiwan EUC
UNICODE Unicode (UTF-8)
MULE_INTERNAL Mule internal code
LATIN1 ISO 8859-1/ECMA 94 (Latin alphabet no.1)
LATIN2 ISO 8859-2/ECMA 94 (Latin alphabet no.2)
LATIN3 ISO 8859-3/ECMA 94 (Latin alphabet no.3)
LATIN4 ISO 8859-4/ECMA 94 (Latin alphabet no.4)
LATIN5 ISO 8859-9/ECMA 128 (Latin alphabet no.5)
LATIN6 ISO 8859-10/ECMA 144 (Latin alphabet no.6)
LATIN7 ISO 8859-13 (Latin alphabet no.7)
LATIN8 ISO 8859-14 (Latin alphabet no.8)
LATIN9 ISO 8859-15 (Latin alphabet no.9)
LATIN10 ISO 8859-16/ASRO SR 14111 (Latin alphabet no.10)
ISO_8859_5 ISO 8859-5/ECMA 113 (Latin/Cyrillic)
ISO_8859_6 ISO 8859-6/ECMA 114 (Latin/Arabic)
ISO_8859_7 ISO 8859-7/ECMA 118 (Latin/Greek)
ISO_8859_8 ISO 8859-8/ECMA 121 (Latin/Hebrew)
KOI8 KOI8-R(U)
ALT Windows CP866
WIN874 Windows CP874 (Thai)
WIN1250 Windows CP1250
WIN Windows CP1251
WIN1256 Windows CP1256 (Arabic)
TCVN TCVN-5712/Windows CP1258 (Vietnamese)

Mój błąd - przyznaję.

Usprawiedliwienie: UTF ani UNICODE nie pojawia się przy instalacji beta5 pod Windą. (Bug?)
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.