Cytat(erix @ 2.09.2010, 11:18:46 )

Owszem, zdążyłem to wszystko przeczytać. Tylko jest jeden problem - kilka tysięcy rekordów, w których mam zapisany właśnie MD5 danych, a nie PUID, do którego musiałbym raczej samodzielnie pisać liba w celu analizy spektrum częstotliwościowego.

Czyżby?
libMusicBrainzCytat
The libmusicbrainz (also known as mb_client or MusicBrainz Client Library) is a development library geared towards developers who wish to add MusicBrainz lookup capabilities to their applications. If you are looking for a complete, usable program to run, please try out Picard.
LibOFACytat
LibOFA (Library Open Fingerprint Architecture) is an open-source audio fingerprint created and provided by MusicIP
Jedno z drugim współpracuje (jeśli dobrze się wczytałem to libmusicbrainz nie posiada w najnowszej odsłonie możliwości tworzenia odcisku palca, co zapewnie libOFA - mogę się mylić). Obie biblioteki napisane są w C/C++, posiadają też wrappery w Pythonie. Jedyne ograniczenie które wynika z komercyjnego charakteru PUID, jest takie że nie możesz dodawać odcisków palca nowych utworów. Biorąc pod uwagę statystyki MusicBrainz jest mało prawdopodobne żebyś na taki trafił.
Amarokowi w najnowszej odsłonie skatalogowanie moich utworów zajmuje ~10min - a ich też jest dużo (i też generuje sumy kontrolne). Ewentualnie możesz skorzystać z ich narzędzia
Picard - generujesz tagi dla swoich plików, później wiążesz je ze swoimi md5. Może nawet byłoby to prostsze niż pisanie zautomatyzowanego skryptu wykorzystującego gołe biblioteki.