Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [optymalizacja] Select Where IN( Select)
Forum PHP.pl > Forum > Bazy danych > MySQL
mkozak
Czesc miszcze od MySql-a,

Mam zagwostkę i pytanie. Here is situation.

Zapytanie :
  1. SELECT count( id ) FROM stats WHERE serviceid
  2. IN ( SELECT id FROM services WHERE name LIKE 'wp%' GROUP BY id)


Tabela stats ma około 70 MB i szczerze powiedziawszy jest kiepsko zoptymalizowana.
Nie starczyło mi cierpliwości, żeby sprawdzić jak długo wykonuje się to zapytanie.

Jeżeli wykonuję je osobno tzn:
  1. SELECT id FROM services WHERE name LIKE 'wp%' GROUP BY id


dostaje 32 rzędy w 0.00 sec

  1. SELECT count( id ) FROM stats WHERE serviceid


dostaje odpowiedź w 0.00 sec

jeżeli wezmę oszukam całą procedurę i wstawie do IN wynik zapytania:
  1. SELECT count( id ) FROM stats WHERE serviceid
  2. IN (60,65,66,67,68,69,70,106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,165,166,167,271)


dostaję odpoeidź w 0.42 sec

Pytanie - dlaczego wykonanie dwóch selectów na raz trwa nieskończenie dłużej niż takie "oszukanie" zapytanie z IN-em??

Jak można przekonać optymalizera MySQL-owego do poprwnej interpretacji??
dr_bonzo
A mozesz dac strukture bazy, z indexami?
Sh4dow
z jednej strony prawdopodobnie brakuje indeksów, ale z drugiej prawdopodobnie tworzenie tymczasowej tablicy zamula serwer. pewnie robi jakis zlaczenie tablic zeby pozniej wybrac z nich dane. Chociaz moge sie mylic.
SongoQ
Sprawdz tak:

  1. SELECT count( services.id ) FROM stats, services WHERE stats.serviceid = services.id AND name LIKE 'wp%'


I teraz tak index na stats.serviceid no i oczywiscie id sa jako PK. Jesli tabele sa jako InnoDB to musisz zrobic relacje. Podaj typ pola name czy to jest varchar czy cos wiekszego. Jesli to jest cos wiekszego to niestety troche trzeba pokombinowac.

Napisz co daje explain dla tego zapytania.

Mozesz tez zamiast services.id dac * ale ine powinno byc roznicy
mkozak
Cytat(Sh4dow @ 1.03.2007, 13:51:18 ) *
z jednej strony prawdopodobnie brakuje indeksów, ale z drugiej prawdopodobnie tworzenie tymczasowej tablicy zamula serwer. pewnie robi jakis zlaczenie tablic zeby pozniej wybrac z nich dane. Chociaz moge sie mylic.



No i to jest ciekawa teoria, bo jeżeli staram się wysterować optymalizera dając SQL_SMALL_RESULT co teoretycznie zmniejsza wielkość tablicy - nie daje żadnego efektu.

Z poprzednimi ripostami iż "brak indexów, albo coś" jakoś się nie zgodzę - przypominam iż osobno zapytania wykonują się bardzo szybko - a na obu tabelach pola id są indexami.

A name jest typu varchar(20)

Ktoś tam prosił o explain
  1. +----+--------------------+----------+------+---------------+------+---------+------+--------+-------------+
  2. | id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra |
  3. +----+--------------------+----------+------+---------------+------+---------+------+--------+-------------+
  4. | 1 | PRIMARY | stats | ALL | NULL | NULL | NULL | NULL | 458920 | USING WHERE |
  5. | 2 | DEPENDENT SUBQUERY | services | ALL | NULL | NULL | NULL | NULL | 275 | USING WHERE |
  6. +----+--------------------+----------+------+---------------+------+---------+------+--------+-------------+


  1. SELECT count( services.id ) FROM stats, services WHERE stats.serviceid = services.id AND name LIKE 'wp%'


Natomiast to zapytanie wykonuje sie bardzo optymalnie - 0.17 sec - dzieki smile.gif - ale jak wyjaśnić tą zagwostkę iż z sub selectem jest niewspółmiernie dłużej niż z podanymi wartosciami.
SongoQ
O ile pamietam to dla kazdej wartosci bedzie jechal podzapytanie. Jest kilka ksiazek na ten temat z podanymi przykladami kiedy warto stosowac IN a kiedy to jest wrecz zabronione
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.