krzys_86
25.01.2012, 00:56:49
Witam.
Podpowie ktoś jak w dobry sposób porównać podobieństwo tekstół, tzn w ilu % pasują do siebie?? Wiem że istnieje similar_text() a coś oprócz tego??
Potrzebuje porównać kilka tekstów i wybrać pasujące do siebie.
Pozdrawiam
Krzysztof
prowseed
25.01.2012, 02:53:08
W jaki sposob chcesz je porownywac? Chcesz korzystac z algorytmow porownawczych?
Mozesz sobie rozbic teksty na olbrzymie tablice i porownywac literka po literce. Wartosc procentowa z wyniku chyba dasz rade policzyc.
Masz jeszcze odleglosc levenshteina:
http://pl.wikipedia.org/wiki/Odległość_Levenshteina i wbudowana funkcja
http://pl.php.net/manual/en/function.levenshtein.phpJesli teksty po angielsku to mozna tez probowac soundex() i metaphone()
krzys_86
25.01.2012, 15:05:03
Dzięki za odpowiedź, pogłębie zaraz temat. Chodzi o to żeby za pomocą algorytmu porównać kilka tekstów (zajawki artykółów) i pogrupować je w podobne do siebie. Bardziej zależy mi na zbadaniu skuteczności takiego porównania

Dzięki wielkie.
prowseed
25.01.2012, 21:43:34
Podobienstwa artykulow nie buduje sie na podstawie tresci, a na podstawie taggow/etykiet. Dołącz do każdej zajawki powiedzmy około 8 etykiet [zależnie od treści która prezentuje] i na ich podstawie buduj podobieństwa
krzys_86
26.01.2012, 00:49:00
tak wiem, najlepszym rozwiązaniem są tagi, ale tutaj chodzi mi bardziej o pracę badawczą jak taki algorytm się sprawdzi. Na dłuższą metę pozabijałoby to pewie serwery, ale do badania wystarczy mi kilka tekstów do porównania.