Hmm, dziwne. Ja w obecnym projekcie uzywam wlasnie preg_replace_callback na kilku(nastu) KB kodu i wykonuje sie on dlugo (ale i tak mniej niz sekunde...) ale glownie ze wzgledu na to co sie dzieje w callbacku (pobieranie danych z bazy i pare innych), jak zostawilem pustego (z odpowiednim returnem) callbacka to calosc smigala standardowo w jakies kilkanascie milisekund.
W systemie szablonow tez tego uzywam i to z znaaaaaacznie bardziej skomplikowanym regexpem (mam jeden - laczony z kilkunastu malych - do wylapywania kazdej - no prawie - mozliwej konstrukcji, wlasnie sprawdzilem.. caly ma ponad 600 znakow), jedna chyba roznica jest taka, ze ja jade plik zrodlowy linia po linii, a nie calosc (bylo mi to potrzebne, zeby moc latwo pokazac w ktorej linii szablonu jest blad). No i nie wiem jak Ty, ale ja kompiluje szablony do php, podobnie jak Smarty tylko, ze szybciej i bez zbednych pierdol

Z tego co piszesz wnioskuje, ze Ty tez masz kompilowalne szablony, w sumie nie widze innego rozwiazania, zeby to bylo wydajnie.
Jeszcze jedna roznica polega na tym, ze ja najpierw wylapuje wszystko co jest w delimiterach przeze mnie ustawionych, a dopiero wewnatrz callbacka robie preg_match z tym duzym regexpem, byc moze to ma jakis wplyw na wydajnosc.
W kazdym razie czasy generacji szablonow z reguly maja 2 zera po przecinku, a nierzadko nawet 3, takze cos napewno masz nie tak jak powinno byc.
Napisz moze cos wiecej, co masz na mysli przez wieksze stringi.