Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Moje własne prawie google - czyli autorska wyszukiwarka do zwykłej strony!
Forum PHP.pl > Inne > Oceny
sniver
Pewien czas temu rozpocząłem rozmyślania nad własną wyszukiwarką w obrębie mojego www. Na początku chciałem zastosować mechanizm google i za jego pomocą stworzyć wyszukiwarke. No ale powiedzmy szczerze - jakoś mi to nie pasowało, a rozwojowość tego rozwiązania jest wiadome niezależna ode mnie...

No więc zrobiłem tak:
1. Przygotowałem sobie mechanizm który z tagów (słów kluczowych) każdej publikacji robi n-gramy 3 i 4 poziomu
2. Napisałem funkcję która w oparciu o algorytm odległości levenstein'a sprawdzi czy szukana fraza moze być błędna - by tak jak w G. gdy wpiszesz: "mikrosoft" pisało: Czy chodzi ci o Microsoft
3. Przygotowałem ładne zapytanie zasówające po bazie i "składające" wyniki w jedną kupę, a przy tym "pozycjonowało" wyniki w taki sposób jak ja tego chcę, czyli - jeśli szukana fraza jest w tytule to ma być najwyżej, jeśli jest w opisie to ma być niżej itd...W tym przypadku jest 5 warunków które określają te rzeczy...

No i tak dobrnąłem do końca. I wyszło mi takie coś:
http://www.youpc.pl/szukaj.html

Dla przykładu źle wpisana fraza:
Szukamy słowa "Mikrosoft": http://www.youpc.pl/szukaj.html?q=Mikrosoft
lub innego "Noika": http://www.youpc.pl/szukaj.html?q=Noika

albo więcej niż 1 słowo:

...np. fraza: "raka cyfrowa": http://www.youpc.pl/szukaj.html?q=raka+cyfrowa


Co sądzicie - czy warto takie coś budować we własnym zakresie?

Dodam tylko że, kwestia optymalizacji i dopracowania działania przede mną - więc będę wdzięczny za każdą konstruktywną i rzeczową odpowiedź
Moli
Ciekawe jest podpowiadanie błędów, na jakiej zasadzie to działa ? Masz osobą tabelę słów czy przeszukuje bazę strony ?
sniver
połączenie n-gramowe z odległością levenshtein - na forum gdzieś w moich poprzednich tematach ten problem był rozwiązywany...

słownik jest w trakcie budowy i będzie powstawać sukcesywnie gdy będą dodawane nowe rzeczy do strony...
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.