Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Wysukiwarka, na tym forum i nie tylko
Forum PHP.pl > Inne > Hydepark
Sedziwoj
Cała sprawa polega na tym, jaka jest minimalna długość szukanego słowa, oraz inne udziwnienia.
A chodzi mi w tej chwili o 3 literowe słowa, czy raczej skróty, jeśli poda się tylko go to nic nie znajdzie, a to trochę kiepski, gdy tych 3-literowych jest dość sporo w informatyce.
No i ogólnie kiedy powinno się i w jakim stopniu wymuszać na użytkowniku odpowiednią długość słowa, co powinno się ignorować itp. itd.
Np. zamiana wszystkich znaków oprócz alfanumerycznych na spacje, czasem to pomaga, a czasem nie, jak nazwa jest cos-tak co jest unikalne, to zamiana myślnika na spacje, powoduje że nie da się po tym wyszukać, a czasem takie widziałem praktyki... choć chyba jedną z gorszych wyszukiwarek pod tym względem ma Allegro.
Czy mamy wyszukiwarki co nie dopuszczając słów złożonych z samych cyfr...


P.S. Może dla tego jest tyle tematów o MVC, bo się o tym nie da znaleźć tematów <lol>
Cysiaczek
http://dev.mysql.com/doc/refman/5.0/en/ful...ine-tuning.html

i wszystko jasne ;]
Pozdrawiam
Sedziwoj
Wiesz, takie stwierdzenie, to jakbyś powiedział "oni nie wiedzą z czego korzystają" ;]
Ja nie wnikam na czym coś stoi, tylko dlaczego tak działa.
Cezar708
albo http://www.sphinxsearch.com/

... i wszystko jasne winksmiley.jpg

Pozdrawiam
Sedziwoj
No i moderator powinien coś zareagować, bo koledzy nie piszą na temat ;P
A tak serio, to nawet nie podsyłajcie linki do takich stron, niedawno trochę je przeglądałem. Mi głównie chodzi dlaczego się nakłada pewne zasady na wyszukiwane frazy.
Cysiaczek
Ok, jeśli się mylę, to mnie poprawcie, ale to chyba chodzi (w przypadku MySQL) o wielkość indeksu tabeli, a więc i wydajność takiego wyszukiwania. Jest nawet mowa o tym, że po zmianie minimalnej wartości dla wyszukiwania, należy przebudować indeksy. smile.gif
Chyba, że w ogóle nie o tym rozmawiamy, ale w takie razie ja nie wiem... zarobiony jestem... niewyspany tongue.gif

Pozdrawiam
wlamywacz
Alllegro nie używam MySql.
Sedziwoj
Cytat(wlamywacz @ 1.10.2008, 09:54:14 ) *
Alllegro nie używam MySql.


A co ma piernik do wiatraka?
wlamywacz
Bo ja wiem... winksmiley.jpg
athabus
Tak z czystej ciekawości to jak działa wyszukiwarka na forum - w sensie fulltext search czy ma własny indeks? Bo ogólnie 3 znaki to jest dobre wyjście - pozwala wyeliminować w indeksie większość słów "przestankowych" i "łączników", ale tak jak pisze Sedziwoj w informatyce to trochę ogranicza wyszukiwanie (sam się kilka razy natknąłem na ten problem).

Ogólnie w indeksie swojej wyszukiwarki dodał bym opcję, aby ignorować 3 znakowe słowa za wyjątkiem zdefiniowanych przez administratora. Jeśli natomiast wyszukiwanie opiera się o fulltext to trochę kaplica, bo wierzę że zmiana domyślnych ustawień indexu na mniejszy o 1 znak oznaczałoby spore "dociążenie" bazy.

//BTW znacie jakieś dobre opensorucowe wyszukiwarki do instalacji na własnej witrynie - szukam czegoś podobnego, ale jakoś na razie nie mogę znaleźć nic co by mi podeszło - albo nie można tego łatwo zmodyfikować, albo jest słabo napisane itd.
Sedziwoj
Cytat(athabus @ 1.10.2008, 11:17:32 ) *
//BTW znacie jakieś dobre opensorucowe wyszukiwarki do instalacji na własnej witrynie - szukam czegoś podobnego, ale jakoś na razie nie mogę znaleźć nic co by mi podeszło - albo nie można tego łatwo zmodyfikować, albo jest słabo napisane itd.


Ogólnie z wyszukiwaniem pełnotekstowym to zależy co potrzebujesz, Lucene jest chyba najlepsza, ale to jedynie jak odpalisz pod Java, bo Zend Luucene na pewno odpada (hm może z symfony? będę musiał spróbować). Masz też te właśnie w bazach jak wspomniane w MySQL, a w PostgreSQL masz Tsearch2 (od wersji 8.3 nie jest tylko zewnętrznym "plugin'em").
Te poważniejsze mają słowniki itp. więc możesz je optymalizować pod względem ignorowanych słów itp. Osobiście wnikałem tylko tyle ile było mi potrzebne, więc niewiele. Jak używać w podstawowej formie.

No właśnie, co do długości słów, to po prostu słowa "przestankowe" "łączniki" wpisać w listę ignorowanych, a resztę przepuszczać, po zindeksowaniu przejrzeć co jest i ile razy i zmodyfikować filtry, w ten sposób będzie "mały" indeks i będzie zawsze użyteczny.
nospor
Cytat
bo Zend Luucene na pewno odpada
czemu?
athabus
Za nosporem czemu?

Akurat, jako że nie znalazłem gotowego rozwiązania z serp'ami, pajączkiem itp, które dałoby mi wszystkie funkcjonalności, których potrzebuję postanowiłem napisać coś samemu opierając się właśnie o Zend_Lucene - chętnie więc poznam słabe strony zanim zabrnę w ślepą uliczkę.
Sedziwoj
Jak to mówią niektóre osoby, można użyć szukaj ;P
Temat: ZendFramework_Zend_Search_Lucene
Pokrótce o co chodzi.

EDIT:
Dodam że czas się poprawia o połowę nawet jak nie ma xdebug'a na serwerze, ale to jest kropla w morzu potrzeb.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.