pcm은 자료 보존 및 음악 감상을 위해 널리 사용되는 멀티미디어 오디오 파일로, 전체 파일을 읽어서 재생할 필요 없이 PCM 파일을 동시에 읽고 재생할 수 있습니다. 다운로드 없이 듣기가 가능합니다. PCM은 펄스 코드 변조라고 하며, PCM의 사운드 데이터는 압축되지 않은 아날로그 신호에서 샘플링, 양자화 및 인코딩을 거쳐 변환된 표준 디지털 오디오 데이터입니다.
이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.
PCM(Pulse Code Modulation)은 펄스 코드 변조라고도 합니다. PCM의 사운드 데이터는 샘플링, 양자화 및 코딩을 통해 변환되는 표준입니다. 오디오 데이터. 샘플링 변환 방법을 이해하려면 아래 그림을 참조하십시오.
오디오 샘플링에는 다음과 같은 주요 요소가 포함됩니다.
샘플링 속도는 오디오 신호의 디지털 스냅샷 수를 나타냅니다. 두번째. 이 속도는 오디오 파일의 주파수 범위를 결정합니다. 샘플링 속도가 높을수록 디지털 파형의 모양이 원래 아날로그 파형에 더 가까워집니다. 낮은 샘플링 속도는 녹음할 수 있는 주파수 범위를 제한하므로 녹음이 원래 사운드를 제대로 표현하지 못할 수 있습니다. 나이퀴스트 샘플링 정리에 따르면 특정 주파수를 재현하려면 샘플링 속도가 해당 주파수의 두 배 이상이어야 합니다. 예를 들어, 일반적인 CD 레코드의 샘플링 속도는 초당 44,100샘플이므로 최대 22,050Hz의 주파수를 재생할 수 있습니다. 이는 인간의 청력 한계인 20,000Hz보다 약간 높은 수치입니다.
사진의 A는 원래 음파를 왜곡하는 효과가 있는 낮은 샘플링 속도의 오디오 신호이고, B는 원래 음파를 완벽하게 재현하는 높은 샘플링 속도의 오디오 신호입니다.
디지털 오디오에 일반적으로 사용되는 샘플링 속도는 다음과 같습니다.
비트 심도는 동적 범위를 결정합니다. 음파를 샘플링할 때 각 샘플에 원래 음파의 진폭에 가장 가까운 진폭 값을 할당합니다. 비트 깊이가 높을수록 더 많은 진폭 값을 제공할 수 있으므로 동적 범위가 커지고 노이즈 플로어가 낮아지며 충실도가 높아집니다.
비트 심도가 높을수록 제공되는 다이내믹 레인지가 커집니다.
위의 명사 분석에서는 PCM에 대한 확실한 이해와 지식이 있어야 합니다. 아래에서는 PCM에 대해 자세히 설명하겠습니다.
PCM 파일은 스트리밍 미디어 특성을 가지며 디지털 통신을 위한 인코딩 방법 중 하나입니다.
PCM 파일은 자료 저장 및 음악 감상에 널리 사용됩니다. PCM 파일은 전체 파일을 읽은 다음 읽을 필요 없이 동시에 읽고 재생할 수 있습니다. 이렇게 하면 다운로드하지 않고도 들을 수 있습니다.
모노 파일인 경우 샘플링 데이터가 시간순으로 저장됩니다. 모노 오디오 파일인 경우 샘플링된 데이터는 시간순으로 저장됩니다(LRLRLR 모드로 저장할 수도 있지만 다른 채널의 데이터는 0입니다).
2채널인 경우 일반적으로 LRLRLR 형식으로 저장됩니다. 저장도 기계의 크고 작은 끝과 관련이 있습니다.
PCM의 저장 방식은 리틀 엔디안 모드입니다. 저장 데이터 데이터는 아래 그림과 같이 배열됩니다.
PCM 오디오 데이터의 매개변수는 다음과 같습니다. 팔로우:
44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2 字节)记录, 双声道(立体声) 22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1 字节)记录, 单声道 48000HZ 32bit 51ch: 每秒钟有 48000 次采样, 采样数据用 32 位(4 字节浮点型)记录, 5.1 声道
44100Hz 指的是采样率,它的意思是每秒取样 44100 次。采样率越大,存储数字音频所占的空间就越大。
16bit 指的是采样精度,意思是原始模拟信号被采样后,每一个采样点在计算机中用 16 位(两个字节)来表示。采样精度越高越能精细地表示模拟信号的差异。
Stereo 指的是声道数,也即采样时用到的麦克风的数量,麦克风越多就越能还原真实的采样环境(当然麦克风的放置位置也是有规定的)。
PCM文件:模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。
将音频数字化,其实就是将声音数字化。最常见的方式是透过脉冲编码调制PCM(Pulse Code Modulation) 。运作原理如下:首先我们考虑声音经过麦克风,转换成一连串电压变化的信号,如下图所示。这张图的横座标为秒,纵座标为电压大小。要将这样的信号转为 PCM 格式的方法,是使用三个参数来表示声音,它们是:声道数、采样位数和采样频率。
采样频率:即取样频率,指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。由于人耳的分辨率很有限,太高的频率并不能分辨出来。在16位声卡中有22KHz、44KHz等几级,其中,22KHz相当于普通FM广播的音质,44KHz已相当于CD音质了,目前的常用采样频率都不超过48KHz。
采样位数:即采样值或取样值(就是将采样样本幅度量化)。它是用来衡量声音波动变化的一个参数,也可以说是声卡的分辨率。它的数值越大,分辨率也就越高,所发出声音的能力越强。
声道数:很好理解,有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的也处理成两个喇叭输出同一个声道的声音),立体声的PCM 可以使两个喇叭都发声(一般左右声道有分工) ,更能感受到空间效果。
下面再用图解来看看采样位数和采样频率的概念。让我们来看看这几幅图。图中的黑色曲线表示的是PCM 文件录制的自然界的声波,红色曲线表示的是PCM 文件输出的声波,横坐标便是采样频率;纵坐标便是采样位数。这几幅图中的格子从左到右,逐渐加密,先是加大横坐标的密度,然后加大纵坐标的密度。显然,当横坐标的单位越小即两个采样时刻的间隔越小,则越有利于保持原始声音的真实情况,换句话说,采样的频率越大则音质越有保证;同理,当纵坐标的单位越小则越有利于音质的提高,即采样的位数越大越好。
在计算机中采样位数一般有8位和16位之分,但有一点请大家注意,8位不是说把纵坐标分成8份,而是分成2的8次方即256份; 同理16位是把纵坐标分成2的16次方65536份; 而采样频率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三种。
那么,现在我们就可以得到PCM文件所占容量的公式:存储量 = (采样频率*采样位数*声道)*时间/8(单位:字节数).
例如,数字激光唱盘(CD-DA,红皮书标准)的标准采样频率为44.lkHz,采样数位为16位,立体声(2声道),可以几乎无失真地播出频率高达22kHz的声音,这也是人类所能听到的最高频率声音。激光唱盘一分钟音乐需要的存储量为:
(44.1*1000*l6*2)*60/8=10,584,000(字节)=10.584MBytes
这个数值就是PCM声音文件在硬盘中所占磁盘空间的存储量。
计算机音频文件的格式决定了其声音的品质,日常生活中电话、收音机等均为模拟音频信号,即不存在采样频率和采样位数的概念,我们可以这样比较一下:
44KHz,16BIT的声音称作:CD音质;
22KHz、16Bit的声音效果近似于立体声(FM Stereo)广播,称作:广播音质;
11kHz、8Bit的声音,称作:电话音质。
微软的WAV文件就是PCM编码的一种。
확장된 지식: PCM 파일과 관련된 기타 파일 형식
Extension | 파일 형식 개발자 | 파일 카테고리 | 파일 형식 설명 |
---|---|---|---|
.SMI | Apple | 디스크 이미지 파일 | 자체 장착 디스크 이미지 |
.AC3 | 다양한 개발자 | 오디오 파일 | 오디오 코덱 3 파일 |
.DV | Roxio | 동영상 파일 | 디지털 비디오 파일 |
.YUV | WinXMedia 소프트웨어 | 비디오 파일 | YUV 비디오 파일 |
.MP4V | Moving Picture Experts Group | 비디오 파일 | MPEG-4 비디오 파일 |
.MP4 | 움직이는 사진 전문가 그룹 | 비디오 파일 | MPEG-4 비디오 파일 |
.IVF | Intel Corporation | 비디오 파일 | Indeo 비디오 형식 파일 |
자세한 내용은 | 을 참조하세요. FAQ | 열! |
위 내용은 pcm은 어떤 파일인가요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!