chciałbym stworzyć dość inteligentny algorytm który sprawdzał by czy w bazie danych nie znajduje się treść którą dodaje user bądź treść bardzo podobna.
Najprościej to zilustrować na przykładnie strony z kawałami. Są kawały na stronie gdy jest ich powiedzmy ponad 7 tyś trudno jest dla takiego administratora zapamiętać który kawał już jest a którego nie ma.
Wiec stworzyć takiego pająka który sprawdzał by bazę w poszukiwaniu takiego samego, lub podobnego kawału np napisanego troszkę inaczej.
Osobiście wymyśliłem coś takiego:
Podaje przykładowy kawał na którym zilustruję mój sposób:
Cytat
Jadą 2 blondynki na rowerach. Nagle jedna z nich zsiada z roweru i zaczyna spuszczać powietrze w obu kołach.
Druga zdziwiona pyta:
- A PO CO TY TO ROBISZ?
- A BO MAM SIODEŁKO ZA WYSOKO!
Na co ta druga zaczyna majstrować przy swoim rowerze i zamieniać miejscami siodełko z kierownicą.
- A TY CO ROBISZ ? - pyta pierwsza.
- ZAWRACAM. NIE BĘDĘ JEŹDZIŁA Z TAKĄ IDIOTKĄ
!
Druga zdziwiona pyta:
- A PO CO TY TO ROBISZ?

- A BO MAM SIODEŁKO ZA WYSOKO!
Na co ta druga zaczyna majstrować przy swoim rowerze i zamieniać miejscami siodełko z kierownicą.
- A TY CO ROBISZ ? - pyta pierwsza.
- ZAWRACAM. NIE BĘDĘ JEŹDZIŁA Z TAKĄ IDIOTKĄ

wyciągamy z danego kawału ciąg 3 słów np "Nagle jedna z" (Ciąg przypadkowy, aby było bardziej optymalne dla kawałów typu Przychodzi baba do lekarza :-) )
i teraz jeżeli znajduje taki ciąg w bazie danych to bierze wycina kolejny losowy ciąg 3 wyrazów np "BO MAM SIODEŁKO"; i sprawdza w tych pasujących czy coś takiego już jest jeżeli okazuje się że jest kawału nie dodaje. w przeciwnym wypadku dodaje kawał do strony.
Teraz nasuwa się pytanie co będzie jak trafi tak że 2 ciągi będą takie same i niby kawały będą inne to skrypt ich nie przepuści.
Interesuje mnie wasze spojrzenie na problem, jak wy byście rozwiązali tą sytuację.
Z góry dziękuję za wszelkie rady.
Pozdrawiam mefjiu