Mam do zrobienia program który będzie prowadził dialog na określony temat z userem. Starając się spełnić założenia testu Touringa (czyli żeby user się nie pokapował że rozmawia z kompem).

I tu mam hipotetyczne zastanowienie.
Muszę wyłowić z tekstu interesujące mnie słowa a resztę usunąć.

Założenia są takie, aby z tekstu który napisze user, wyłapać tylko te kluczowe słowa.

W pierwszej kolejności myślałem, aby pobrany z posta tekst, rozdzielić i np. wsadzić je do tablicy.
Ale ni cholery nie mam pojęcia jak zrobić żeby żeby przeszukiwał mi tą cholerną tablicę w poszukiwaniu, słów dla mnie istotnych.
Teoretyczny efekt miał by być taki, że wyciągne powiedzmy ze 100 słów jakie są napisane 70 po wywaleniu znaków interpunkcyjnych wszystkich i,z,a i takich podobnych rzeczy.
Biorę potem to co mi zostanie i wsadzam je w selecta, który przelatuje mi przez całą (nazwałe ją biblioteka bo tam będą zapisane treści arytkułów, prawnych których będzie dot. pytanie) bibliotekę.
i sortuje wedle maxymalnej ilości znalezionych.

Drugi to wsadzić całe pytanie usera, jak leci do bazy. I na tym jechać zaindexowanymi słowami. Najwyższe wartości porównywane w tym momencie były by z tytułem art. bądź jego opisem. Tak aby słowa w pytaniu usera takie jak "pit" "kara" piep..ony "urząd skarbowy", wskazały na kara za złe wypełnienie pitów przez urząd skarbowy. Albo kary nakładane przez urząd skarbowy (jeszcze nie wiem do końca jak zrobić odmianę słów ).

Jak narazie optuje bardziej za drugim.
Efekt finalny to taki, że jeżeli w 1 ilość odnalezionych słów kluczowych w będzie wystarczająco duża, to leci odpowiedź do użytkownika wraz z treścią artykułu. W wypadku 2 wybiera po tytule bądź kluczowym opisie (jeszcze muszę to przemyśleć) i tak samo wysyła userowi. Jak w 1 będzie za mało i w 2 (jakoś też), to puszcza najbliższą (wcześniej ustawionej zmiennej z ilości potrzebnych znalezień) trafieniu odpowiedź wraz z informacją o doprecyzowanie pytania....

Jak wy to widzicie? Bo może błądzę zupełnie nie w tą stronę co trzeba (pytanie usera, to normalny text wklepany z klawiatury - ale na konkretny temat czyli wypełnianie pitów i etc.)