为什么音频信号的采样频率一般取44.1KHZ

发布网友发布时间：2022-04-22 08:56

共5个回答

热心网友时间：2023-06-26 02:44

通常我们采用脉冲代码调制编码，即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。 \x0d\x0a\x0d\x0a　　1、什么是采样率和采样大小（位/bit）？ \x0d\x0a\x0d\x0a　　频率对应于时间轴线，振幅对应于电平轴线。波是无限光滑的，弦线可以看成由无数点组成，由于存储空间是相对有限的，数字编码过程中，必须对弦线的点进行采样。采样的过程就是抽取某点的频率值，很显然，在一秒中内抽取的点越多，获取得频率信息更丰富，为了复原波形，一次振动中，必须有2个点的采样，人耳能够感觉到的最高频率为20kHz，因此要满足人耳的听觉要求，则需要至少每秒进行40k次采样，用40kHz表达，这个40kHz就是采样率。我们常见的CD，采样率为44.1kHz。光有频率信息是不够的，我们还必须获得该频率的能量值并量化，用于表示信号强度。量化电平数为2的整数次幂，我们常见的CD位16bit的采样大小，即2的16次方。采样大小相对采样率更难理解，因为要显得抽象点，举个简单例子：假设对一个波进行8次采样，采样点分别对应的能量值分别为A1-A8，但我们只使用2bit的采样大小，结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小，则刚好记录下8个点的所有信息。采样率和采样大小的值越大，记录的波形更接近原始信号。 \x0d\x0a\x0d\x0a　　2、有损和无损 \x0d\x0a\x0d\x0a　　根据采样率和采样大小可以得知，相对自然界的信号，音频编码最多只能做到无限接近，至少目前的技术只能这样了，相对自然界的信号，任何数字音频编码方案都是有损的，因为无法完全还原。在计算机应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，CD、DVD以及我们常见的WAV文件中均有应用。因此，PCM约定俗成了无损编码，因为PCM代表了数字音频中最佳的保真水准，并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴，是相对PCM编码的。强调编码的相对性的有损和无损，是为了告诉大家，要做到真正的无损是困难的，就像用数字去表达圆周率，不管精度多高，也只是无限接近，而不是真正等于圆周率的值。 \x0d\x0a\x0d\x0a　　3、为什么要使用音频压缩技术 \x0d\x0a\x0d\x0a　　要算一个PCM音频流的码率是一件很轻松的事情，采样率值×采样大小值×声道数bps。一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的WAV文件，它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3，对应的WAV的参数，就是这个1411.2 Kbps，这个参数也被称为数据带宽，它和ADSL中的带宽是一个概念。将码率除以8，就可以得到这个WAV的数据速率，即176.4KB/s。这表示存储一秒钟采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的音频信号，需要176.4KB的空间，1分钟则约为10.34M，这对大部分用户是不可接受的，尤其是喜欢在电脑上听音乐的朋友，要降低磁盘占用，只有2种方法，降低采样指标或者压缩。降低指标是不可取的，因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样，各种音频压缩编码所达到的音质和压缩比都不一样，在后面的文章中我们都会一一提到。有一点是可以肯定的，他们都压缩过。 \x0d\x0a\x0d\x0a　　4、频率与采样率的关系 \x0d\x0a\x0d\x0a　　采样率表示了每秒对原始信号采样的次数，我们常见到的音频文件采样率多为44.1KHz，这意味着什么呢？假设我们有2段正弦波信号，分别为20Hz和20KHz，长度均为一秒钟，以对应我们能听到的最低频和最高频，分别对这两段信号进行40KHz的采样，我们可以得到一个什么样的结果呢？结果是：20Hz的信号每次振动被采样了40K/20=2000次，而20K的信号每次振动只有2次采样。显然，在相同的采样率下，记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因，CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号，看来需要更高的采样率，于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率，这是不可取的！这其实对音质没有任何好处，对抓轨软件来说，保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一，而不是去提高它。较高的采样率只有相对模拟信号的时候才有用，如果被采样的信号是数字的，请不要去尝试提高采样率。 \x0d\x0a\x0d\x0a　　因为，根据耐奎斯特采样理论，你的采样频率必须是信号最高频率的两倍。例如，音频信号的频率一般达到20Hz，因此其采样频率一般需要40Hz。而人耳收听的范围只能到23Khz以下，所以CD的采样率才是44.1Khz。22Khz×2=44Khz,考虑到一定的余量采用44.1Khz. \x0d\x0a\x0d\x0a　　5、流特征 \x0d\x0a\x0d\x0a　　随着网络的发展，人们对在线收听音乐提出了要求，因此也要求音频文件能够一边读一边播放，而不需要把这个文件全部读出后然后回放，这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放，正是这种特征，可以实现在线的直播，架设自己的数字广播电台成为了现实。

热心网友时间：2023-06-26 02:44

通常我们采用脉冲代码调制编码，即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

　　1、什么是采样率和采样大小（位/bit）？

　　频率对应于时间轴线，振幅对应于电平轴线。波是无限光滑的，弦线可以看成由无数点组成，由于存储空间是相对有限的，数字编码过程中，必须对弦线的点进行采样。采样的过程就是抽取某点的频率值，很显然，在一秒中内抽取的点越多，获取得频率信息更丰富，为了复原波形，一次振动中，必须有2个点的采样，人耳能够感觉到的最高频率为20kHz，因此要满足人耳的听觉要求，则需要至少每秒进行40k次采样，用40kHz表达，这个40kHz就是采样率。我们常见的CD，采样率为44.1kHz。光有频率信息是不够的，我们还必须获得该频率的能量值并量化，用于表示信号强度。量化电平数为2的整数次幂，我们常见的CD位16bit的采样大小，即2的16次方。采样大小相对采样率更难理解，因为要显得抽象点，举个简单例子：假设对一个波进行8次采样，采样点分别对应的能量值分别为A1-A8，但我们只使用2bit的采样大小，结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小，则刚好记录下8个点的所有信息。采样率和采样大小的值越大，记录的波形更接近原始信号。

　　2、有损和无损

　　根据采样率和采样大小可以得知，相对自然界的信号，音频编码最多只能做到无限接近，至少目前的技术只能这样了，相对自然界的信号，任何数字音频编码方案都是有损的，因为无法完全还原。在计算机应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，CD、DVD以及我们常见的WAV文件中均有应用。因此，PCM约定俗成了无损编码，因为PCM代表了数字音频中最佳的保真水准，并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴，是相对PCM编码的。强调编码的相对性的有损和无损，是为了告诉大家，要做到真正的无损是困难的，就像用数字去表达圆周率，不管精度多高，也只是无限接近，而不是真正等于圆周率的值。

　　3、为什么要使用音频压缩技术

　　要算一个PCM音频流的码率是一件很轻松的事情，采样率值×采样大小值×声道数bps。一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的WAV文件，它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3，对应的WAV的参数，就是这个1411.2 Kbps，这个参数也被称为数据带宽，它和ADSL中的带宽是一个概念。将码率除以8，就可以得到这个WAV的数据速率，即176.4KB/s。这表示存储一秒钟采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的音频信号，需要176.4KB的空间，1分钟则约为10.34M，这对大部分用户是不可接受的，尤其是喜欢在电脑上听音乐的朋友，要降低磁盘占用，只有2种方法，降低采样指标或者压缩。降低指标是不可取的，因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样，各种音频压缩编码所达到的音质和压缩比都不一样，在后面的文章中我们都会一一提到。有一点是可以肯定的，他们都压缩过。

　　4、频率与采样率的关系

　　采样率表示了每秒对原始信号采样的次数，我们常见到的音频文件采样率多为44.1KHz，这意味着什么呢？假设我们有2段正弦波信号，分别为20Hz和20KHz，长度均为一秒钟，以对应我们能听到的最低频和最高频，分别对这两段信号进行40KHz的采样，我们可以得到一个什么样的结果呢？结果是：20Hz的信号每次振动被采样了40K/20=2000次，而20K的信号每次振动只有2次采样。显然，在相同的采样率下，记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因，CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号，看来需要更高的采样率，于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率，这是不可取的！这其实对音质没有任何好处，对抓轨软件来说，保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一，而不是去提高它。较高的采样率只有相对模拟信号的时候才有用，如果被采样的信号是数字的，请不要去尝试提高采样率。

　　因为，根据耐奎斯特采样理论，你的采样频率必须是信号最高频率的两倍。例如，音频信号的频率一般达到20Hz，因此其采样频率一般需要40Hz。而人耳收听的范围只能到23Khz以下，所以CD的采样率才是44.1Khz。22Khz×2=44Khz,考虑到一定的余量采用44.1Khz.

　　5、流特征

　　随着网络的发展，人们对在线收听音乐提出了要求，因此也要求音频文件能够一边读一边播放，而不需要把这个文件全部读出后然后回放，这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放，正是这种特征，可以实现在线的直播，架设自己的数字广播电台成为了现实。

热心网友时间：2023-06-26 02:45

要知道答案，就得从最早期数码录音的历史说起了。
最早期的数码录音设备，就是一个PCM编码器加一部录像机！最早期，这样的数码录音设备是玩家级的，日本各大厂家都曾经出过，并且是当时主要的数码录音设备。后来SONY才推出了使用高稳定性高质素3/4专业录像机的编码解码系统PCM 1610（进化到PCM 1630）。录像机是采用旋转磁头螺旋磁迹纪录的，磁迹是按照视频信号结构安排的，是不连续的，每一条磁迹，只纪录了电视信号中的其中一条扫描线（有关电视视频信号的知识，在此不多说了）。用录像机做数码录音的前提，是不能改装改造录像机。因此编码器就必须将数码音频信号，转换成电视视频信号，这样录像机才能纪录。因此，编码器输出的信号必须迁就录像机的规格。也就是说，数码音频信号，必须拆分成不连续的，以电视行数码线为基础的数据流，才能让录像机完整纪录。
在当时，世界上的录像机主要有二大制式。就是欧洲的PAL制式和美国日本的NTSC制式。PAL制式，场频50Hz，行频15625Hz，每一场625条扫描线。NTSC制式，场频59.94Hz（接近但不是60Hz），行频15575Hz，每一场525条扫描线。（说到这儿，罗嗦几句。PAL制式比NTSC制式先进得多。千万别跟我说以前LD美版的日版的如何如何牛B。那是节目源的问题，因为你没看过真正好的欧洲版PAL制式的LD。以前日本的影像发烧友最推崇的DVD，不是美国1区版，不是日本自己2区版，而是欧洲版！！！受日本的影响，香港的发烧DVD玩家，也专门订购欧洲版DVD，我自己订购回来的法国版PAL制式《泰坦尼克号》的画质，比我自己的1区正版《泰坦尼克号》赢出一轮）。当时的CD，是SONY与PHILIPS合作的。
PHILIPS代表欧洲制式，SONY代表美日制式。因为世界上的大唱片公司都在欧洲，而且PHILIPS自己就是其中一个，在软件出版的地位是SONY无法抗衡的，因此，最终决定，即使是日本出品的PCM编码器，也只适用于PAL制式的录像机。适用于PAL制式录像机的编码器，其采样频率就是44.1kHz。适用于NTSC制式录像机的编码器，其采样频率就是44.056。早期，日本确有一些采用44.056kHz采用频率的数码录音，但后来统一到44.1kHz了。那么44.1和44.056kHz这二个数字是怎么来的呢？44,100=294 x 50 x 344,056=245 x 59.94 x 350Hz和59.94Hz分别是PAL和NTSC的场频，294和245是从PAL和NTSC的线数上来的，因为是隔行扫描的，所以扫描线数要除2。故此PAL的扫描线就变成312.5而NTSC则变成262.5。但在模拟电视时代，为确保电视画面内容完整，所以摄像机，录像机，电视机都采用过扫描技术，最上，最下，最左，最右的部分都给舍去了。因此，无论PAL还是NTSC制式的实际扫描线，都比625和525少。PAL制式下可用扫描线数是294线，而NTSC则是245线。至于x3，则是在一条视频扫描线的磁迹中，纪录三个数码音频数据块。于是，就有了上面的式子，就有了44.1kHz。44.1kHz这个数字，给后人留下了很多麻烦。
首先它不是整数，在SRC（采样频率变换）的时候，它不能简单地分频和倍频，这就给早期的电脑的AC97音频规格，带来了SRC转换质素的问题。当时的电脑声卡都要遵循AC97规格，只支持48kHz输出，用电脑播放CD或者CD抓轨的音频文件，都要加以转换。转换的过程会有损失，而其中创新的声卡的SRC程序特别的臭，所以创新声卡播放CD或者44.1kHz音频文件的音质，被广泛劣评。至于DAT，没有这个问题，因为它的44.1和48kHz采样频率，都是原生的，不是转换出来的。不转换就不会劣化。

热心网友时间：2023-06-26 02:45

学过信号处理或者信号与系统后
采样定理
使得离散信号恢复成连续模拟信号不失真至少要让采样频率为原始信号的2倍
耳机播放频率22KHz(一般标注0-20KHz)
所以音频记录文件要22×2=44KHz
为了保险起见要再多一点儿
人为规定44.1KHz

热心网友时间：2023-06-26 02:46

居然还有这种想当然的回答，还多100赫兹余量，为什么不多200,300,或400呢。
网上有很专业的回答了，就是PAL和NTSC录像带记录音频必须按照视频的规范来写磁轨，就像录音磁带一样。最后就成了60*245*3 = 44100和50*294*3 = 44100。