Witam serdecznie opis tematu brzmi całkiem banalnie ale w praktyce rzeczywiście jest dosyć trudnym zagadnieniem (przynajmniej jak dla mnie). W swoim projekcie wykorzystuje wyszukiwanie używając indexów fulltext search. Wyszukiwarka działa bardzo szybko co daje znaczną przewagę nad 'like' a ponadto nie trzeba podać dokładnych słów kluczowych, jednak w tym momencie pojawia sie spory problem. Otóż przy wyszukiwaniu jakiegoś złożonego tekstu dla przykładu 'Jan Sebastian Bach' pojawia sie duży rozrzut w wynikach. Jakoś uzyskiwanego wyniku przy dwóch wystapieniach Sebastian jest lepsza niż w przypadku znalezienia w tekście samego Bacha

To oczywiście jest bardzo logiczne jednak stanowi dość rozbudowany problem (bo wiadomo że wolałbym żeby znalazł sie Bach ). Czy ktoś konstruował algorytm do oceny takich wyników?
Jakieś pomysł na rozwiązanie tego problemu?(oczywiście nie wchodzi w grę stosowanie flagi "IN BOOLEAN MODE" bo to wykluczy z rozważań wszelkie odpowiedzi będące odmianami danych słów.)