Opisze problem:
#Istnieje ebook Pan Tadeusz (100kb 100 000znaków z spacją . txt)
#Istnieje baza słów [100 000] rekordów w mysql tj, dom, krzesło, lalka
Chciałbym sprawdzić czy dany rekord z bazy słów występuje w ebooku,
Jeżeli tak to chciałbym usunąć go z ebooka (z zmiennej)
Wynikiem analizy będzie informacja ile razy dane słowo zostało znalezione w ebooku,
Znalezione słowa zostaną usunięte z treści i zostanie treść, która nie ma zawartych słów z bazy słów.
Proszę o informację jak postępować z taką ilością danych. Czy zawartość ebook załadować do zmiennej? Czy może do tablicy z podziałem na wiersze tekstu jako elementy tabeli? A może załadować treść pliku do SQL?. Jak optymalnie zaplanować przepytanie treści epoka 100 000 razy przez poszczególne słówka z bazy słów.
Jaka funkcja w takim wypadku będzie najbardziej optymalna strpos, wyrażenia regularne? czasami szukamy wyrazu a czasami frazę (dwa wyrazy)
Proszę o koncepcję jak za to się zabrać