Nie do końca wiedziałem jak zatytułować temat, bo nie chodzi tu o pomoc w kodzie, potrzebuje tylko różnych opini jak można rozwiązać ten problem. Mianowicie wygląda to następująco, parsuje informacje o eventach z roznych stron, o ile nazwy eventow sa do siebie bardzo podobne jak nie identyczne to kategorie do ktorych naleza te eventy na poszczegolnych stronach roznia sie czasem znacząco. O ile informacje o eventach moge zapisac w swojej bazie pod jednym ID (z pomoca przychodza funkcje php do operacji na stringach np.: similar_text), to ciezko juz jest zrobic ten sam "myk" z zapisaniem eventu do jedenj kategorii w mojej bazie, a potrzebuje tego do pozniejszych operacji tylko na eventach z danej kategorii.
No i teraz moje pytanie, jak najlepiej rozwiazac problem znacząco różniacych sie kategorii? Myślałem na napisaniu jakiegos "prostownika/translatora" kategorii, po prostu tablica ktora pod kluczem o wartości ID z mojej bazy przechowywalaby tablice z nazwami kategorii z roznych stron, tylko, że liczba tych kategorii jest ogromna

Drugi pomysł to po prostu znalezienie jakiejś strony bazowej i na podstawie podobieństw w nazwach eventow przypisywanie konkretnej kategorii.