Pytanie haczy o logiczne myślenie... Jak wysyłając obrazek i mając go jako bezpośredni output chcesz wrzucić tam jeszcze tekst? Albo wysyłasz sam obrazek i własciwe headery, albo sam tekst i też wlasciwy header, albo plujesz jakąś formą komunikacji, choćby XML, z opisem i lokalizacją obrazka lub jego werją potraktowaną base64. To co chcesz zrobić jest nawet na logikę biorąc, nienormalne... Chcesz serwować grafikę jednocześnie z tekstem ustawiając jakiś header lub ich mix

Jeszcze powiedz, że ciurkiem i przeglądarka ma zgadnąć gdzie się kończy obrazek, a gdzie zaczyna tekst