Mam sobie dwa pliki , jeden wyglada mniej wiecej tak :
Cytat
spam ../data/inmail.1
ham ../data/inmail.2
spam ../data/inmail.3
spam ../data/inmail.4
spam ../data/inmail.5
spam ../data/inmail.6
spam ../data/inmail.7
spam ../data/inmail.8
spam ../data/inmail.9
ham ../data/inmail.10
spam ../data/inmail.11
spam ../data/inmail.12
spam ../data/inmail.13
spam ../data/inmail.14
spam ../data/inmail.15
ham ../data/inmail.2
spam ../data/inmail.3
spam ../data/inmail.4
spam ../data/inmail.5
spam ../data/inmail.6
spam ../data/inmail.7
spam ../data/inmail.8
spam ../data/inmail.9
ham ../data/inmail.10
spam ../data/inmail.11
spam ../data/inmail.12
spam ../data/inmail.13
spam ../data/inmail.14
spam ../data/inmail.15
Drugi tak :
Cytat
inmail.10
inmail.10002
inmail.10004
inmail.10011
inmail.10012
inmail.10013
inmail.10015
inmail.10018
inmail.10019
inmail.1002
inmail.10020
inmail.10026
inmail.10027
inmail.10028
inmail.10030
inmail.10031
inmail.10002
inmail.10004
inmail.10011
inmail.10012
inmail.10013
inmail.10015
inmail.10018
inmail.10019
inmail.1002
inmail.10020
inmail.10026
inmail.10027
inmail.10028
inmail.10030
inmail.10031
Pierwszy z nich zawiera ok 75tys wierszy, drugi zas kolo 15tys.
inmail.xxx to nazwy pewnych plikow.
mniejszy zbior to wyciagniete pewne nazwy z wiekszego ale jak widac bez przedrostka 'spam' lub 'ham', no i teraz zadanie polega na tym zeby porownac ze soba te pliki i dopisac do tego mniejszego przedrostki, nie musza one byc przed nazwa, moga byc po, wazne zeby stworzyc taki indeks ktory bedzie zawieral zarowno nazwy inmail.xxx jak i przedrostki 'ham' lub 'spam'
Jak narazie zrobilem sobie tylko taka funkcje ktora wrzuca wszystkie nazwy z plikow do tablicy :
//pobiera nazwy z pliku i wrzuca do tablicy public function getFilenameArray($filename) { return $array; }
No i teraz nie wiem , czy porownywac dwie tablice powstale z tych plikow , czy sa jakies lepsze sposoby ? no i jak najlepiej wyciagnac przedrostek 'spam' lub 'ham' i przepisac je do tej krotszej listy, tak aby nazwy plikow i przedrostki byly oczywiscie takie same jak w tym wiekszym pliku (liscie)