Forum PHP.pl > Porównywanie tekstów

Pomoc - Szukaj - Użytkownicy - Kalendarz

krzys_86

25.01.2012, 00:56:49

Witam.

Podpowie ktoś jak w dobry sposób porównać podobieństwo tekstół, tzn w ilu % pasują do siebie?? Wiem że istnieje similar_text() a coś oprócz tego??

Potrzebuje porównać kilka tekstów i wybrać pasujące do siebie.

Pozdrawiam

Krzysztof

prowseed

25.01.2012, 02:53:08

W jaki sposob chcesz je porownywac? Chcesz korzystac z algorytmow porownawczych?

Mozesz sobie rozbic teksty na olbrzymie tablice i porownywac literka po literce. Wartosc procentowa z wyniku chyba dasz rade policzyc.
Masz jeszcze odleglosc levenshteina: http://pl.wikipedia.org/wiki/Odległość_Levenshteina i wbudowana funkcja http://pl.php.net/manual/en/function.levenshtein.php
Jesli teksty po angielsku to mozna tez probowac soundex() i metaphone()

krzys_86

25.01.2012, 15:05:03

Dzięki za odpowiedź, pogłębie zaraz temat. Chodzi o to żeby za pomocą algorytmu porównać kilka tekstów (zajawki artykółów) i pogrupować je w podobne do siebie. Bardziej zależy mi na zbadaniu skuteczności takiego porównania

Dzięki wielkie.

prowseed

25.01.2012, 21:43:34

Podobienstwa artykulow nie buduje sie na podstawie tresci, a na podstawie taggow/etykiet. Dołącz do każdej zajawki powiedzmy około 8 etykiet [zależnie od treści która prezentuje] i na ich podstawie buduj podobieństwa

krzys_86

26.01.2012, 00:49:00

tak wiem, najlepszym rozwiązaniem są tagi, ale tutaj chodzi mi bardziej o pracę badawczą jak taki algorytm się sprawdzi. Na dłuższą metę pozabijałoby to pewie serwery, ale do badania wystarczy mi kilka tekstów do porównania.

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.