Mam baze danych, z takimi oto ustawieniami charsetów:
Kod
| character_set_client | latin2 |
| character_set_connection | latin2 |
| character_set_database | latin2 |
| character_set_filesystem | binary |
| character_set_results | latin2 |
| character_set_server | latin2 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
| collation_connection | latin2_general_ci |
| collation_database | latin2_general_ci |
| collation_server | latin2_general_ci |
| character_set_connection | latin2 |
| character_set_database | latin2 |
| character_set_filesystem | binary |
| character_set_results | latin2 |
| character_set_server | latin2 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
| collation_connection | latin2_general_ci |
| collation_database | latin2_general_ci |
| collation_server | latin2_general_ci |
Mam również plik z mysqldumpa, który jest zakodowany w iso-8859-2 oraz zawiera polskie znaki.
Na jego początku jest coś takiego:
Kod
/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0
*/;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8 */;
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
/*!40014 SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0 */;
/*!40014 SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0
*/;
/*!40101 SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='NO_AUTO_VALUE_ON_ZERO' */;
/*!40111 SET @OLD_SQL_NOTES=@@SQL_NOTES, SQL_NOTES=0 */;
Zakładam, że są to zapytanie wykonywane przy imporcie, jeśli tak, to zapewne /*!40101 SET NAMES utf8 */; sprawia problemy, ale ciężko jest mi wyedytować prawie 700 MiB plik, więc narazie go zostawiłem.
I teraz tak:
W konsoli, jak robie sobie cat'a na nim - mając ustawione kodowanie utf-8 (w konsoli), to mam krzaczki.
Gdy robie to samo, ale mając ustawione iso-8859-2, to są normalne polskie znaki. Czyli wiadomo, że plik jest faktycznie zakodowany w iso-8859-2.
Gdy próbuje importować tego dumpa do bazy, to zamiast polskich znaków, mam znaki zapytania (robi się między innymi konflik na polu z indeksem unique i zakańcza import).
Wcześniej przekonwertowany dump na utf-8 za pomoca inconv'a nie ma tego problemu.
I teraz pytanie:
Czy da się jakoś zaimportować tego dumpa, bez konieczności konwersji?
Czy da się zrobić tego dumpa, bez tych komend, które między innymi ustawiają mi klienta i połączenie z serwerem na utf-8?