Alex, я думал, ты-то уж должен быть в курсе всей этой кухни. FFT - потому что нет других способов эффективного шумоподавления. И алгоритм его довольно простой:
1. (необязательно) Мерим уровень шума для каждый частоты по отдельности на отрывке фонограммы без музыки (тем же FFT)
2) делаем FFT кусками с перекрытием
3) мерим амплитуду каждой частоты, и если она ниже шумовой полки - просто обнуляем её (есть ещё вариант с просто вычитанием амплитудного спектра без учёта фаз)
4) делаем обратное FFT, суммируем их с перекрытием.
MP3 делает то же самое, только обнуляет частоты исходя не из уровня шумовой полки, а из заданной пропускной способности (ну и не через FFT, а через косинусное преобразование, что ещё больше фазы портит). Ну и фронты понятно почему калечатся - чем более узкополосная фильтрация, тем медленнее затухает синусоидальный "хвост", а здесь она ещё и максимально неравномерная. Это легко услышать, если взять soundforge и в noise reduction накрутить уровень шумоподавления от души. И сравнить с сильно пережатым MP3, килобит в 48.
Социальные закладки