Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Text hash
Forum PHP.pl > Forum > PHP
markuz
Cześć,

Potrzebuję algorytmu/skryptu który wykona coś podobnego co biblioteka https://github.com/jenssegers/imagehash tylko dla tekstu. Imagehash tworzy hash dla obrazka, jeżeli jest zmieniony rozmiar, dodany jakiś znak wodny itp. to nadal obrazki będą miały taki sam hash.

Teraz chciałbym otrzymać podobny hash dla tekstu np. mamy opis produktu w którym została zmieniona kolejność zdań, wielkość liter, kilka słów jest innych, dodana jest jakaś stopka itp. - hash powinien zostać taki sam. Macie jakieś pomysły?
Pyton_000
To jeszcze powiedz do czego tego potrzebujesz
markuz
Do porównywania opisów produktów - niektórzy mogą go trochę zmienić dodając ogłoszenie od nowa (ale nadal ogłoszenie dotyczy tego samego produktu, tylko np. zmieniła się cena). Inni wstawią ogłoszenie w różnych miejscach i ten tekst też może się "trochę" różnić - ale nadal ogłoszenie dot. tego samego produktu - i ja właśnie chcę w jakiś sposób połączyć te ogłoszenia (jeżeli nie będą mieć zdjęć).
Pyton_000
To może być bardzo trudne.

Musiałbyś wziąć wiele czynników pod uwagę.
Przychodzi mi do głowy jedynie rozbicie tekstu na słowa i porównywanie ich pod różnymi kątami np. ilość słów, róznica w tekście, wylicznie % podobieństwa na podstawie zdań itd. itd.

Może to coś pomoże: https://packagist.org/packages/php-text-ana...p-text-analysis
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.