相位声码器
相位声码器是声码器的一种,它借由改变声音频号的相位信息,而达到音频时域与频域上的延展。时域与频域的延展分别对应到此音频在时间上的缩放(速度快慢改变),与声音音高的改变。
相位声码器的与传统声码器最主要的差别在于:不同于传统声码器将音频切割成多个频带,相位声码器是使用短时距傅里叶变换(STFT),得到不只各频格(frequency bin)的强度(ampiltude),也得到相位(phase)的信息。此技术之所以被称为「相角」音码器,是因为我们把声音频号转为频谱之后, 并非只是单纯地在强度频谱上,时间或者频率的维度内插,还必须考虑相角与频率的关系,并在相角频谱上进行相对应的调整。相位声码器将特定频率分量的振幅或相位修改后,透过反向短时傅里叶转换(inverse STFT)将频谱还原成时域的音频。若改变STFT音框在时间上的位置,可以改变重新合成的声音的时间演变。