Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [MYSQL] Usuwanie zduplikowanych wpisów w tabeli
Forum PHP.pl > Forum > Przedszkole
-Majestiq-
Mam tabele o nazwie TAB i strukturze:

id int (11)
tytul varchar(50)
dlugosc varchar(200)
link varchar(200)
data date
czas varchar(200)
rozmiar varchar(200)
licznik int(10)

Pytanie - jakim poleceniem mogę usunąć wszystkie wiersze (poza 1) o tym samym tytule z tej tabeli ?
Szukałem ale rozwiązania były bardziej skomplikowane niż by się mogło wydawać i nie udało mi się do tej pory uzyskać zamierzonego efektu :/

Czy to ze większość pól jest varchar(200) ma wpływ na szybkość zapytań SELECT ?

Mam serwer na nazwa.pl i co chwila blokuje mi bazę z powodu przekroczenia czasu zapytań na godzinę czy jakoś tak (limit 600s na godzinę)
a tak naprawdę wszystkie zapytania to selecty na tej jednej tabeli i dziwie się że tak szybko limit wykorzystuje - co by było o zgrozo gdybym miał wiele tabel i na nich wykonywał operacje, chyba w ogóle od razu by mi baza padła.

W bazie (tabela tab) jest około 100 000 rekordów, ale przecież to nie dużo jak na bazę danych.

Proszę o pomoc.
pacior
  1. SELECT DISTINCT tytul FROM TAB
Cysiaczek
Ja mam to samo niestety przy jednym sklepie (skończy się chyba na VPS). Tu nie wielkość tabeli ma znaczenie, a to, jak dużo danych pobierasz jednokrotnie. Może to nie jest potrzebne? Limit jest na czas operacji na bazie danych, więc taki zabieg pomoże. Chyba, że masz dużo odwołań, wtedy nic nie zrobisz. Niestety, nazwa.pl pod tym względem sobie kpi z klientów - pewnie liczą na to, że klient zapłaci z dedykowaną bazę danych i kupi ich VPS ;/

Co do usuwania:
Wyciągnij rekord i rekord o nazwie takiej samej jak ten pierwszy (w podzapytaniu: tabelebis.tytul=tabela.tytul). Jeśli wynik da 2 i więcej rekordów, skasuj je w następnym zapytaniu (już przecież masz ich ID).

Pozdrawiam.
Crozin
A odpowiednie indexy na tabele pozakładane masz? winksmiley.jpg
Cysiaczek
Indeksy tu nie pomogą, choć trochę przyspieszają. To jest wina nazwa.pl i ich limitu. Nie chce tu rozpoczynać dyskusji o nazwa.pl, ale teraz jest 600 sekund (10 minut), a niedawno było 900 sekund (15 minut). Wystarczy średni sklep z rozbudowaną administracją i nazwa.pl wymięka. Policzcie sobie np. 0.06 sekundy na jedną odsłonę i macie:
10000 odsłon = 600 sekund

Dla części publicznej styknie, ale teraz policzcie sobie synchro z jakąś hurtownią, operacje na produktach, kwarendy. Tu zapytania czasem są liczone w sekundach.

Pozdrawiam.
Gość
Cytat(Cysiaczek @ 17.05.2008, 14:44:22 ) *
Ja mam to samo niestety przy jednym sklepie (skończy się chyba na VPS). Tu nie wielkość tabeli ma znaczenie, a to, jak dużo danych pobierasz jednokrotnie. Może to nie jest potrzebne? Limit jest na czas operacji na bazie danych, więc taki zabieg pomoże.


Tzn. jaki :-)
To usunięcie duplikatów ?

Cytat
Co do usuwania:
Wyciągnij rekord i rekord o nazwie takiej samej jak ten pierwszy (w podzapytaniu: tabelebis.tytul=tabela.tytul). Jeśli wynik da 2 i więcej rekordów, skasuj je w następnym zapytaniu (już przecież masz ich ID).


A mógłbyś mi napisać cały kod dla tej tabeli.
Niestety jestem początkującym SQLowcem i mam duże problemy z troszkę bardziej skomplikowanymi rzeczami :|


A to SELECT DISTINCT tytul from TAB tak jak kolega na początku radził nie pomoże questionmark.gif

Co do mojej bazy to czasem jednocześnie kilkadziesiąt osób ja odpytuje (select) no i rozumiem z tego co mówicie, że nazwa.pl nie nadaje się zupełnie dla mnie ?!

No i sprawa tych indeksów o których mówicie?
Mogą one 'coś' pomóc (jak mówię w sumie tylko 1 tabela jest wykorzystywana przy większości zapytań) ?
Ciężko je założyć ?

No i ostatnia sprawa - jakby komuś chciało się luknąć na tego posta:
http://forum.php.pl/PHPMYSQLProblem_z_wysz...rka_t94012.html

Może mam tam w którymś miejscu coś strasznie niezoptymalizowanego i można by to kilkukrotnie przyśpieszyć.
Szczególnie jeśli chodzi o plik szukarka.php

Najczęściej jest chyba wykonywane zapytanie:

  1. $sql = 'SELECT id,tytul,rozmiar,licznik FROM `'.$tabelka.'` WHERE `tytul` LIKE '%'.$wykonawca.'%' ORDER by tytul ';
  2. $result123 = mysql_query($sql);
  3. $rekordow = mysql_num_rows($result123);


Może można tu coś zmienić questionmark.gif
Gość
Odpowie mi ktoś na to: http://forum.php.pl/index.php?showtopic=94...st=#entry472306 questionmark.gif
-Majestic-
Czy ma sens sprawdzanie jak długo wykonuje się SELECT za pomocą:

  1. <?php
  2. $czas1=microtime(); 
  3. $sql = 'SELECT * FROM ...';
  4. $czas2=microtime(); 
  5. $czas=$czas2-$czas1; 
  6. echo $czas;
  7. ?>


Bo jakiś mam dziwny rozrzut w wynikach dla tych samych zapytań ...
Crozin
Jeżeli chcesz znać czas w jakim wykonywało się zapytanie SQL - to tak, ma to sens.
-Majestiq-
A czy można to (czas wykonywania) sprawdzić jakoś bezpośrednio po stronie serwera ?

Prosiłbym jeszcze o odpowiedź na posta nr 3 :-)
.radex
W sensie jak bezpośrednio po stronie serwera? Sposób obliczenia czasu wykonania sam podałeś.
-Majestiq-
Sorki, masz rację - miałem na myśli nie w php tylko jakimś poleceniem SQLowym bo ten sposób, który podałem
zwraca mi bardzo różne czasy dla tych samych zapytań.

Czy jeśli SELECT zwraca mi powiedzmy 100 rekordów a ja dam LIMIT 20 to czy rzeczywiście zapytanie będzie o 4/5 szybsze questionmark.gif
-Majestiq-
Jeszcze jedna sprawa co do sposobu obliczania czasy zapytań podanego przeze mnie.

Select wykonywał się około 0.3 sekundy i zwrócił kilka tysięcy rekordów, jednak na ekranie wynik pojawił mi się po dopiero ładnych kilku sekundach.
'Wydrukowanie' tych danych na ekran albo przetworzenie zwróconego wyniku w php trwało aż tak długo czy o co chodzi questionmark.gif
.radex
Nie rozumiem, dlaczego chcesz w to angażować bazę danych? Baza danych ma być od przechowywania danych, a SQL ma być sposobem ich przetwarzania. Takimi detalami powinien zająć się język skryptowy (w tym przypadku PHP). Po za tym chyba nie jest możliwe zrobienie tego poprzez zapytanie.
Gość
Nie chce znać czasu wykonywania z poziomu skryptu ...
Jest chyba jakieś polecenie cośw stylu BENCHMARK ... chyba w PHPmyAdmin można wpisać
majestiq
Muszę odświerzyć temat:

Mam tabele o nazwie TAB i strukturze:
id int (11)
tytul varchar(50)
dlugosc varchar(200)
link varchar(200)
data date
czas varchar(200)
rozmiar varchar(200)
licznik int(10)

i chciałbym usunąć wszystkie (poza jednym - ostatnim bądź pierwszym) rekordy, które mają identyczne tytuły.
Tutaj ktoś podawał sposób, ale coś mi to nie wychodzi.

Mógłby ktoś napisać takie zapytanie dla tej konkretnie tabeli ?

Z góry wielkie dzięki!
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.