MP3压缩技术简介
MP3压缩技术的压缩步骤主要包括:脉码调变(PCM)、时域/频域转换、声音心理学模型、讯号包装等:
>脉码调变(PCM)
先将类比的声音讯号经由取样、量化、编码转换为数位讯号,图中的虚线代表脉码调变取出的数位讯号,可以看出如果X轴为时间,则低频的声音振动较慢,高频的声音振动较快。
>时域/频域转换(Time/Frequency mapping)
将原本X轴为“时间”的数位讯号,转换成X轴为“频率”的数位讯号,图中的虚线代表脉码调变取出的数位讯号,可以看出如果转换成X轴为频率,则讯号的形状改变,而且低频的声音在X轴的左边,高频的声音在X轴的右边。要将X轴由时间转换为频率最简单的方法是使用“傅利叶转换(Fourier transform)”,这是属于工程数学的一种运算,在此不再详细描述。
>声音心理学量化
实验发现人类的耳朵对极高频与极低频的声音并不敏感,就算将它去除也不会被听出来,所以我们依照声音心理学模型将高频(>5KHz)与低频(<3KHz)的数位讯号除以较大的分母(让不重要的讯号变小),滤掉部分高频与低频的声音讯号,可以减少不重要的数位讯号,才能节省记忆体空间,但是人类的耳朵听不太出来;
大家可能会好奇,为什么在进行MP3压缩的时候要先将X轴为“时间”转换成X轴为“频率”呢?现在看出来了吗?X轴为时间的讯号,所有频率的声音都混在一起,很难将高频与低频的讯号滤掉或减少;X轴为频率的讯号,低频的声音在X轴的左边,高频的声音在X轴的右边,很容易将高频与低频的讯号滤掉或减少,
>讯号包装(Frame packing)
将处理好的数位讯号依序排列。