Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: Parser HTML
Forum PHP.pl > Forum > PHP
ciepakxxx
Nie do końca wiedziałem jak zatytułować temat, bo nie chodzi tu o pomoc w kodzie, potrzebuje tylko różnych opini jak można rozwiązać ten problem. Mianowicie wygląda to następująco, parsuje informacje o eventach z roznych stron, o ile nazwy eventow sa do siebie bardzo podobne jak nie identyczne to kategorie do ktorych naleza te eventy na poszczegolnych stronach roznia sie czasem znacząco. O ile informacje o eventach moge zapisac w swojej bazie pod jednym ID (z pomoca przychodza funkcje php do operacji na stringach np.: similar_text), to ciezko juz jest zrobic ten sam "myk" z zapisaniem eventu do jedenj kategorii w mojej bazie, a potrzebuje tego do pozniejszych operacji tylko na eventach z danej kategorii.

No i teraz moje pytanie, jak najlepiej rozwiazac problem znacząco różniacych sie kategorii? Myślałem na napisaniu jakiegos "prostownika/translatora" kategorii, po prostu tablica ktora pod kluczem o wartości ID z mojej bazy przechowywalaby tablice z nazwami kategorii z roznych stron, tylko, że liczba tych kategorii jest ogromna wink.gif

Drugi pomysł to po prostu znalezienie jakiejś strony bazowej i na podstawie podobieństw w nazwach eventow przypisywanie konkretnej kategorii.


Daimos
Dobrze kombinujesz, też bym tak zrobił, że utworzyłbym główną tabelę z kategoriami i tabelę z wariacjami, które kierują odpowiednio na tabelę poprzednią. Nie ma tu problemu, żebyś miał ich setki tysięcy

kategorie
category_id, category_name

wariacje
category_variation_id
category_variation_category_id - klucz do tabeli kategorie, którym wiążesz wszystko
category_variation_name
ciepakxxx
No tak, tylko troszkę słabo wyjdzie ze złożonością, bo będę musiał przeszukać wszystkie eventy, w celu znalezienia tego któremu dany event z innej strony odpowiada.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.