Forum PHP.pl > [MYSQL] Usuwanie zduplikowanych wpisów w tabeli

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [MYSQL] Usuwanie zduplikowanych wpisów w tabeli

-Majestiq-

17.05.2008, 14:33:55

Mam tabele o nazwie TAB i strukturze:

id int (11)
tytul varchar(50)
dlugosc varchar(200)
link varchar(200)
data date
czas varchar(200)
rozmiar varchar(200)
licznik int(10)

Pytanie - jakim poleceniem mogę usunąć wszystkie wiersze (poza 1) o tym samym tytule z tej tabeli ?
Szukałem ale rozwiązania były bardziej skomplikowane niż by się mogło wydawać i nie udało mi się do tej pory uzyskać zamierzonego efektu :/

Czy to ze większość pól jest varchar(200) ma wpływ na szybkość zapytań SELECT ?

Mam serwer na nazwa.pl i co chwila blokuje mi bazę z powodu przekroczenia czasu zapytań na godzinę czy jakoś tak (limit 600s na godzinę)
a tak naprawdę wszystkie zapytania to selecty na tej jednej tabeli i dziwie się że tak szybko limit wykorzystuje - co by było o zgrozo gdybym miał wiele tabel i na nich wykonywał operacje, chyba w ogóle od razu by mi baza padła.

W bazie (tabela tab) jest około 100 000 rekordów, ale przecież to nie dużo jak na bazę danych.

Proszę o pomoc.

pacior

17.05.2008, 14:43:03

[SQL] pobierz, plaintext 
SELECT DISTINCT tytul FROM TAB
[SQL] pobierz, plaintext

Cysiaczek

17.05.2008, 14:44:22

Ja mam to samo niestety przy jednym sklepie (skończy się chyba na VPS). Tu nie wielkość tabeli ma znaczenie, a to, jak dużo danych pobierasz jednokrotnie. Może to nie jest potrzebne? Limit jest na czas operacji na bazie danych, więc taki zabieg pomoże. Chyba, że masz dużo odwołań, wtedy nic nie zrobisz. Niestety, nazwa.pl pod tym względem sobie kpi z klientów - pewnie liczą na to, że klient zapłaci z dedykowaną bazę danych i kupi ich VPS ;/

Co do usuwania:
Wyciągnij rekord i rekord o nazwie takiej samej jak ten pierwszy (w podzapytaniu: tabelebis.tytul=tabela.tytul). Jeśli wynik da 2 i więcej rekordów, skasuj je w następnym zapytaniu (już przecież masz ich ID).

Pozdrawiam.

Crozin

17.05.2008, 15:58:06

A odpowiednie indexy na tabele pozakładane masz?

Cysiaczek

17.05.2008, 16:24:48

Indeksy tu nie pomogą, choć trochę przyspieszają. To jest wina nazwa.pl i ich limitu. Nie chce tu rozpoczynać dyskusji o nazwa.pl, ale teraz jest 600 sekund (10 minut), a niedawno było 900 sekund (15 minut). Wystarczy średni sklep z rozbudowaną administracją i nazwa.pl wymięka. Policzcie sobie np. 0.06 sekundy na jedną odsłonę i macie:
10000 odsłon = 600 sekund

Dla części publicznej styknie, ale teraz policzcie sobie synchro z jakąś hurtownią, operacje na produktach, kwarendy. Tu zapytania czasem są liczone w sekundach.

Pozdrawiam.

Gość

17.05.2008, 16:40:48

Cytat(Cysiaczek @ 17.05.2008, 14:44:22 )

Tzn. jaki :-)
To usunięcie duplikatów ?

Cytat

Co do usuwania:
Wyciągnij rekord i rekord o nazwie takiej samej jak ten pierwszy (w podzapytaniu: tabelebis.tytul=tabela.tytul). Jeśli wynik da 2 i więcej rekordów, skasuj je w następnym zapytaniu (już przecież masz ich ID).

A mógłbyś mi napisać cały kod dla tej tabeli.
Niestety jestem początkującym SQLowcem i mam duże problemy z troszkę bardziej skomplikowanymi rzeczami :|

A to SELECT DISTINCT tytul from TAB tak jak kolega na początku radził nie pomoże

Co do mojej bazy to czasem jednocześnie kilkadziesiąt osób ja odpytuje (select) no i rozumiem z tego co mówicie, że nazwa.pl nie nadaje się zupełnie dla mnie ?!

No i sprawa tych indeksów o których mówicie?
Mogą one 'coś' pomóc (jak mówię w sumie tylko 1 tabela jest wykorzystywana przy większości zapytań) ?
Ciężko je założyć ?

No i ostatnia sprawa - jakby komuś chciało się luknąć na tego posta:
http://forum.php.pl/PHPMYSQLProblem_z_wysz...rka_t94012.html

Może mam tam w którymś miejscu coś strasznie niezoptymalizowanego i można by to kilkukrotnie przyśpieszyć.
Szczególnie jeśli chodzi o plik szukarka.php

Najczęściej jest chyba wykonywane zapytanie:

[SQL] pobierz, plaintext 
$sql = 'SELECT id,tytul,rozmiar,licznik FROM `'.$tabelka.'` WHERE `tytul` LIKE '%'.$wykonawca.'%' ORDER by tytul ';
$result123 = mysql_query($sql);
$rekordow = mysql_num_rows($result123);
[SQL] pobierz, plaintext

Może można tu coś zmienić

Gość

18.05.2008, 05:45:45

Odpowie mi ktoś na to: http://forum.php.pl/index.php?showtopic=94...st=#entry472306

-Majestic-

18.05.2008, 09:21:49

Czy ma sens sprawdzanie jak długo wykonuje się SELECT za pomocą:

[PHP] pobierz, plaintext 
<?php
$czas1=microtime(); 
$sql = 'SELECT * FROM ...';
$czas2=microtime(); 
$czas=$czas2-$czas1; 
echo $czas;
?>
[PHP] pobierz, plaintext

Bo jakiś mam dziwny rozrzut w wynikach dla tych samych zapytań ...

Crozin

18.05.2008, 10:01:06

Jeżeli chcesz znać czas w jakim wykonywało się zapytanie SQL - to tak, ma to sens.

-Majestiq-

18.05.2008, 10:25:25

A czy można to (czas wykonywania) sprawdzić jakoś bezpośrednio po stronie serwera ?

Prosiłbym jeszcze o odpowiedź na posta nr 3 :-)

.radex

18.05.2008, 10:27:09

W sensie jak bezpośrednio po stronie serwera? Sposób obliczenia czasu wykonania sam podałeś.

-Majestiq-

18.05.2008, 11:08:26

Sorki, masz rację - miałem na myśli nie w php tylko jakimś poleceniem SQLowym bo ten sposób, który podałem
zwraca mi bardzo różne czasy dla tych samych zapytań.

Czy jeśli SELECT zwraca mi powiedzmy 100 rekordów a ja dam LIMIT 20 to czy rzeczywiście zapytanie będzie o 4/5 szybsze

-Majestiq-

18.05.2008, 11:13:54

Jeszcze jedna sprawa co do sposobu obliczania czasy zapytań podanego przeze mnie.

Select wykonywał się około 0.3 sekundy i zwrócił kilka tysięcy rekordów, jednak na ekranie wynik pojawił mi się po dopiero ładnych kilku sekundach.
'Wydrukowanie' tych danych na ekran albo przetworzenie zwróconego wyniku w php trwało aż tak długo czy o co chodzi

.radex

18.05.2008, 12:53:57

Nie rozumiem, dlaczego chcesz w to angażować bazę danych? Baza danych ma być od przechowywania danych, a SQL ma być sposobem ich przetwarzania. Takimi detalami powinien zająć się język skryptowy (w tym przypadku PHP). Po za tym chyba nie jest możliwe zrobienie tego poprzez zapytanie.

Gość

18.05.2008, 13:14:47

Nie chce znać czasu wykonywania z poziomu skryptu ...
Jest chyba jakieś polecenie cośw stylu BENCHMARK ... chyba w PHPmyAdmin można wpisać

majestiq

20.05.2008, 07:32:06

Muszę odświerzyć temat:

Mam tabele o nazwie TAB i strukturze:
id int (11)
tytul varchar(50)
dlugosc varchar(200)
link varchar(200)
data date
czas varchar(200)
rozmiar varchar(200)
licznik int(10)

i chciałbym usunąć wszystkie (poza jednym - ostatnim bądź pierwszym) rekordy, które mają identyczne tytuły.
Tutaj ktoś podawał sposób, ale coś mi to nie wychodzi.

Mógłby ktoś napisać takie zapytanie dla tej konkretnie tabeli ?

Z góry wielkie dzięki!

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.