Spróbuj zapoznać z tym o wav, bo masz tam napisane o strukturze pliku:
http://209.85.129.132/search?q=cache:qN80v...=clnk&gl=plhttp://4programmers.net/Delphi/Artykuły/Od...e_wave_z_WinAPICo do mp3 to zerknij do linku niżej. Masz tam historię, ale także strukturę zapisu ramek mp3. Gdzieś tak w połowie dokumentu sie zaczyna
http://www.zse.ids.czest.pl/materialy/mp3.pdfOgólnie to czego szukasz musisz wyłapać poprzez przejrzenie sieci pod kątem słów: struktura pliku, struktura danych, specyfikacja, algorytm oraz nazwami danych standardów.
Problem będziesz mieć nieco z midi, ponieważ tam definiujesz każdy kanał osobno dla każdego instrumentu i dlatego się mówiło ile MIDi jest kanałowe. Każdy z nich odpowiadał za "grę" jednego instrumentu.
EDIT: Tak czy inaczej będziesz zmuszony do pracy z danymi binarnymi i analizowanie konkretnych bajtów pliku, nagłówków itp. Na pewno nie jest to user-friendly, choć w sumie można fajnie potrenować przy implementacji algorytmu konkretnego. O ile wav to raczej stałe, proste dane, to ciekawie musiałoby to wglądać dla mp3 z vbr.