Mam pytanie, czy znacie jakiś sposób na rozróżnianie w sklepach podstron produktu od podstrony kategorii lub głównej itp.
Tworzę narzędzie do parsowania produktów w sklepach. Wszystko już działa, ale niestety potrafi parsować strony typu kategorie znajduje tam czasem ceny itp. Różne przypadki w zależności od sklepu.
Są podobne już narzędzia na rynku którę sobie z tym radzą, ale nie mam pojęcia na jakiej zasadzie tworzą te warunki. jakieś maski czy coś?
Dla przykładu
to jest strona kategorii:
https://www2.hm.com/pl_pl/ona/produkty/bluzy.html
https://www.cropp.com/pl/pl/dziewczyna/clot...kurtki-plaszcze
https://www.reserved.com/pl/pl/woman/accessories/shoes
To jest strona produktu:
https://www2.hm.com/pl_pl/productpage.0993762003.html
https://www.cropp.com/pl/pl/1326k-08x/kurtka-k-cr
https://www.reserved.com/pl/pl/1296l-50x/klapki-k-re
No i teraz jak można wykluczyć strony nie będące produktami, wiem że to nie będzie jedna zasada i może się nie uda odrazu wykluczyć wszystkich sklepów, ale jakiś przynajmniej odsetek

Znacie podobne rozwiązania?