Posiadam bazę danych z tekstami (kawały). Każdy kawał może mieć maksymalnie 1000 znaków. W jaki sposób (najbardziej optymalny) sprawdzić czy kawał istnieje już w bazie danych? Może ktoś z Was posiada jakiś fajny pomysł? Chodzi o to, że nawet jeżeli kawał nieco zmieni strukturę bądź np. będą w nim inne imiona itp. to aby nadal wykrywało iż kawał nie jest oryginalny.
Proszę o pomoc i opinie
