音视频编程ffmepg中的关键术语与概念：深度解析与实践（一）-阿里云开发者社区

1. 音视频编程基础（Basics of Audio and Video Programming）

1.1 音频和视频的基本概念（Basic Concepts of Audio and Video）

在我们开始深入探讨音视频编程的关键术语和概念之前，首先让我们回到基础，理解一下音频和视频的基本概念。

音频（Audio）

音频，顾名思义，是关于声音的。在计算机科学中，音频是指所有可听的声音，包括人的语音、音乐、环境声音等。音频数据可以以模拟信号或数字信号的形式存在。在音频编程中，我们通常处理的是数字音频，因为数字音频可以通过计算机系统进行处理、存储和传输。

音频数据的基本属性包括采样率（Sample Rate）、位深（Bit Depth）和声道数（Channel Number）。

采样率（Sample Rate）：这是指每秒钟对音频信号进行采样的次数，单位是Hz（赫兹）。常见的采样率有44.1kHz、48kHz等，其中44.1kHz是CD音质的采样率。
位深（Bit Depth）：这是指每个采样点的数据位数，常见的有16位（2字节）、24位（3字节）等。位深越大，音频数据的精度越高，声音的质量也越好。
声道数（Channel Number）：这是指音频数据中的声道数量，如单声道（Mono）、双声道（Stereo）、5.1声道等。

视频（Video）

视频是由一系列连续的图像组成的，通过快速连续播放这些图像，我们的眼睛和大脑就会产生连续运动的错觉，这就是所谓的视频。视频数据通常包括一系列的帧（Frame），每一帧都是一个静态的图像。

视频数据的基本属性包括分辨率（Resolution）、帧率（Frame Rate）和色彩空间（Color Space）。

分辨率（Resolution）：这是指视频帧的宽度和高度，单位是像素。常见的分辨率有480p（SD）、720p（HD）、1080p（Full HD）、4K等。
帧率（Frame Rate）：这是指每秒钟显示的帧数，单位是fps（frames per second）。常见的帧率有24fps、30fps、60fps等。
色彩空间（Color Space）：这是指用于表示颜色的数学模型。常见的色彩空间有RGB、YUV等。

在接下来的章节中，我们将深入探讨音频和视频编程中的关键术语和概念，包括音频的立体声（Stereo）、多声道（Multichannel）、采样格式（Sample Format）如PCM、FLTP等，以及视频的编码格式（Codec Format）如H.264、H.265等，和色彩空间（Color Space）如YUV、RGB等。我们还将介绍音视频流处理中的关键术语，如流媒体协议（Streaming Protocol）RTMP、HLS等，容器格式（Container Format）如MP4、MKV等，以及编解码库（Codec Library）如FFmpeg、Libav等。最后，我们将通过实践应用的例子，展示如何在编程中应用这些知识。

1.2 音频编程关键术语和概念（Key Terms and Concepts in Audio Programming）

在音频编程中，我们会遇到许多专业术语和概念。理解这些术语和概念对于深入理解音频编程至关重要。

立体声（Stereo）

立体声是一种音频录制和播放技术，它使用两个独立的音频信号来模拟人类的双耳听觉，从而创建出一种空间感。在音频编程中，我们通常需要处理立体声音频数据，这意味着我们需要处理两个独立的音频信号或声道。

多声道（Multichannel）

多声道音频是一种音频编码技术，它使用多个独立的音频信号或声道来创建出更丰富的空间感。常见的多声道音频格式包括5.1声道、7.1声道等。在音频编程中，处理多声道音频数据比处理立体声音频数据更复杂，因为我们需要处理更多的独立声道。

采样格式（Sample Format）

采样格式是指音频数据的数据格式，它决定了音频数据的精度和质量。常见的采样格式包括PCM、FLTP等。

PCM（Pulse Code Modulation）：这是一种最基本的数字音频格式，它直接记录了声音波形的样本值。PCM音频数据的精度和质量取决于采样率和位深。
FLTP（Floating Point Planar）：这是一种使用浮点数表示音频样本值的格式。FLTP音频数据的精度和质量通常比PCM音频数据更高。

在音频编程中，我们需要根据音频数据的采样格式来选择合适的处理方法和算法。

在接下来的章节中，我们将深入探讨这些音频编程的关键术语和概念，并通过实践应用的例子，展示如何在编程中应用这些知识。

1.3 视频编程关键术语和概念（Key Terms and Concepts in Video Programming）

视频编程也有其特定的术语和概念。理解这些术语和概念对于深入理解视频编程至关重要。

编码格式（Codec Format）

编码格式（Codec Format）是视频编程中的一个重要概念。编码格式定义了如何将原始的视频数据（通常是连续的图像帧）压缩成更小的数据，以便于存储和传输。常见的编码格式包括H.264、H.265、VP9等。每种编码格式都有其特定的压缩算法和特性，选择合适的编码格式可以根据具体的应用需求，如压缩效率、图像质量、解码性能等。

色彩空间（Color Space）

色彩空间（Color Space）是视频编程中的另一个重要概念。色彩空间定义了如何表示一个图像帧中的颜色。常见的色彩空间包括RGB、YUV等。RGB色彩空间使用红色（R）、绿色（G）和蓝色（B）三个通道来表示颜色，而YUV色彩空间则使用亮度（Y）和两个色差（U和V）来表示颜色。不同的色彩空间有不同的特性和应用场景，选择合适的色彩空间可以根据具体的应用需求，如图像质量、存储效率等。

2. 音频编程中的关键术语（Key Terminology in Audio Programming）

2.1 立体声（Stereo）和多声道（Multichannel）解析

在音频编程中，理解声道（Channel）的概念是非常重要的。声道是指音频信号在空间中的传播路径，它可以是物理的，如扬声器，也可以是虚拟的，如音频文件中的音频流。在音频编程中，我们常常会遇到如立体声（Stereo）和多声道（Multichannel）等术语，这些都是描述声道布局（Channel Layout）的方式。

立体声（Stereo）

立体声是最常见的声道布局，它包含两个声道：左声道（Left）和右声道（Right）。在立体声中，左右声道的音频信号是不同的，这种差异可以创建出音源在空间中的位置感，为听众带来更丰富、更真实的听觉体验。在音频编程中，我们可以通过编程方式来控制左右声道的音频信号，以实现立体声效果。

在FFmpeg中，我们可以使用AV_CH_LAYOUT_STEREO常量来表示立体声布局。例如，我们可以这样设置编解码器的声道布局：

AVCodecContext* codec_ctx = ...; // 编解码器上下文
codec_ctx->channel_layout = AV_CH_LAYOUT_STEREO; // 设置为立体声布局

多声道（Multichannel）

多声道是指包含两个以上声道的声道布局。除了立体声之外，常见的多声道布局还包括四声道（Quadraphonic）、五点一声道（5.1 Surround）等。多声道可以提供更丰富的空间音效，使听众仿佛身临其境。

在FFmpeg中，我们可以使用如AV_CH_LAYOUT_QUAD、AV_CH_LAYOUT_5POINT1等常量来表示多声道布局。例如，我们可以这样设置编解码器的声道布局：

AVCodecContext* codec_ctx = ...; // 编解码器上下文
codec_ctx->channel_layout = AV_CH_LAYOUT_5POINT1; // 设置为5.1声道布局

在处理多声道音频时，我们需要注意每个声道的音频信号是独立的，我们需要分别处理每个声道的音频数据。

以上就是立体声和多声道的基本概念和在音频编程中的应用。在下一节中，我们将介绍音频的采样格式，如PCM、FLTP等。

2.2 音频采样格式（Audio Sample Formats）

音频采样格式是指音频数据的表示方式，它决定了音频数据的精度和存储方式。在音频编程中，我们常常会遇到如PCM、FLTP等采样格式。

脉冲编码调制（Pulse Code Modulation, PCM）

脉冲编码调制是最常见的音频采样格式，它是数字音频的基础。在PCM中，音频信号被均匀地采样，并且每个采样点都被量化为一个固定位数的值。例如，16位PCM就是每个采样点被量化为一个16位的整数。

在FFmpeg中，PCM采样格式被表示为AV_SAMPLE_FMT_S16（16位有符号整数）、AV_SAMPLE_FMT_S32（32位有符号整数）等。例如，我们可以这样设置编解码器的采样格式：

AVCodecContext* codec_ctx = ...; // 编解码器上下文
codec_ctx->sample_fmt = AV_SAMPLE_FMT_S16; // 设置为16位PCM

浮点采样格式（Floating-Point Sample Formats）

除了整数PCM之外，音频数据也可以被表示为浮点数。浮点采样格式可以提供更高的精度和动态范围，但是它也需要更多的存储空间和计算资源。

在FFmpeg中，浮点采样格式被表示为AV_SAMPLE_FMT_FLT（单精度浮点数）、AV_SAMPLE_FMT_DBL（双精度浮点数）等。例如，我们可以这样设置编解码器的采样格式：

AVCodecContext* codec_ctx = ...; // 编解码器上下文
codec_ctx->sample_fmt = AV_SAMPLE_FMT_FLT; // 设置为单精度浮点数

以上就是音频采样格式的基本概念和在音频编程中的应用。在下一节中，我们将介绍音频的采样率和位深。

2.3 音频采样率和位深（Sampling Rate and Bit Depth）

音频采样率和位深是音频质量的两个重要参数，它们决定了音频的精度和动态范围。

音频采样率（Sampling Rate）

音频采样率是指每秒钟采样的次数，单位通常是Hz（赫兹）。例如，44100Hz的采样率表示每秒钟采样44100次。采样率越高，音频的频率响应范围越宽，音质越好。常见的音频采样率有44100Hz（CD质量）、48000Hz（DVD质量）等。

在FFmpeg中，我们可以这样设置编解码器的采样率：

AVCodecContext* codec_ctx = ...; // 编解码器上下文
codec_ctx->sample_rate = 44100; // 设置为44100Hz

音频位深（Bit Depth）

音频位深是指每个采样点的数据位数。位深越高，音频的动态范围越大，音质越好。常见的音频位深有16位（CD质量）、24位（高解析度音频）等。

在FFmpeg中，音频位深是通过采样格式来表示的。例如，AV_SAMPLE_FMT_S16表示16位的整数PCM，AV_SAMPLE_FMT_FLT表示32位的浮点数。

以上就是音频采样率和位深的基本概念和在音频编程中的应用。在下一节中，我们将介绍音频的声道布局。

3. 视频编程中的关键术语（Key Terminology in Video Programming）

3.1 视频分辨率：SD，HD，4K等

视频分辨率（Resolution）是衡量视频质量的重要指标，它描述了视频画面中水平和垂直方向上的像素数量。分辨率越高，视频中的细节就越丰富，画面就越清晰。常见的视频分辨率包括SD（Standard Definition，标清）、HD（High Definition，高清）、Full HD（Full High Definition，全高清）、2K、4K、8K等。

3.1.1 SD（Standard Definition，标清）

SD是标准清晰度的简称，通常指的是分辨率为480i（720x480像素）或576i（720x576像素）的视频。在SD视频中，画面的宽度和高度分别是720和480或576像素。这种分辨率的视频在早期的电视和DVD中非常常见。

3.1.2 HD（High Definition，高清）

HD是高清晰度的简称，通常指的是分辨率为720p（1280x720像素）的视频。在HD视频中，画面的宽度和高度分别是1280和720像素。这种分辨率的视频在现代的电视和网络视频中非常常见，它的画面质量明显高于SD。

3.1.3 Full HD（Full High Definition，全高清）

Full HD是全高清晰度的简称，通常指的是分辨率为1080p（1920x1080像素）的视频。在Full HD视频中，画面的宽度和高度分别是1920和1080像素。这种分辨率的视频在高端电视和蓝光光盘中非常常见，它的画面质量明显高于HD。

3.1.4 2K

2K是一种高分辨率的视频格式，通常指的是分辨率为2048x1080像素的视频。在2K视频中，画面的宽度和高度分别是2048和1080像素。这种分辨率的视频在电影制作和高端电视中非常常见。

3.1.5 4K

4K是一种超高分辨率的视频格式，通常指的是分辨率为4096x2160像素或3840x2160像素的视频。在4K视频中，画面的宽度和高度分别是4096和2160像素或3840和2160像素。这种分辨率的视频在电影制作、高端电视和网络视频中非常常见，它的画面质量明显高于2K和Full HD。4K视频的高分辨率使得画面中的细节更加丰富，能够展示出其他视频格式无法呈现的细节[¹]。

3.1.6 8K

8K是一种超高分辨率的视频格式，通常指的是分辨率为7680x4320像素的视频。在8K视频中，画面的宽度和高度分别是7680和4320像素。这种分辨率的视频在电影制作、高端电视和网络视频中非常常见，它的画面质量明显高于4K。

3.2 音频格式和编码

音频格式和编码是音频处理的核心概念。在音频编码过程中，原始音频数据被转换为特定格式的数据，以便于存储或传输。音频编码的目标是在保持音质的同时，尽可能地减少数据的大小。下面我们将详细介绍几种常见的音频格式和编码方式。

3.2.1 PCM (Pulse Code Modulation，脉冲编码调制)

PCM是一种无损的音频编码格式，它直接对音频信号进行采样、量化和编码，不进行任何压缩。PCM编码的音频数据质量高，但数据量大，通常用于CD等高质量音频的存储。

在PCM编码中，音频信号首先被均匀采样，然后每个采样点被量化为一个固定位数的数字。例如，CD音频使用44.1kHz的采样率和16位的量化位数，每秒需要存储44100162（双声道）= 1.4Mbps的数据。

3.2.2 FLAC (Free Lossless Audio Codec，自由无损音频编解码器)

FLAC是一种流行的无损音频编码格式，它使用了一种类似于ZIP的无损压缩算法，可以在不损失音质的情况下减少音频数据的大小。FLAC编码的音频数据质量与原始PCM数据相同，但数据量只有原始数据的50%-60%。

FLAC编码首先对PCM数据进行预处理，然后使用一种叫做线性预测编码（LPC）的方法对预处理后的数据进行压缩。预处理包括交织（将多个声道的数据混合在一起）和装箱（将多个采样点组合在一起）。LPC是一种预测编码方法，它试图找到一个预测函数，使得预测值与实际值的差值（残差）最小。残差序列通常比原始数据更容易压缩。

3.2.3 MP3 (MPEG-1 Audio Layer III)

MP3是一种非常流行的有损音频编码格式，它使用了一种称为感知编码的技术，通过剔除人耳无法听到的音频信息，达到压缩数据的目的。MP3编码的音频数据量远小于PCM和FLAC，但音质也有所下降。

在MP3编码中，音频信号首先被分割为短的帧，每一帧都被单独编码。每一帧内的音频数据首先被转换到频域，然后通过一个

心理声学模型进行处理，剔除人耳无法听到的音频信息。最后，剩下的数据被量化并编码为比特流。

3.2.4 AAC (Advanced Audio Coding)

AAC是一种比MP3更先进的有损音频编码格式，它提供了更高的音质和更低的数据量。AAC编码使用了更复杂的心理声学模型和更高效的编码算法，可以提供比MP3更好的音质，特别是在低比特率下。

AAC编码的过程与MP3类似，也是将音频信号分割为短的帧，然后对每一帧进行频域转换和心理声学处理。但AAC使用了更复杂的心理声学模型，可以更准确地剔除人耳无法听到的音频信息。此外，AAC还使用了一种叫做临时噪声形状量化（TNS）的技术，可以进一步提高编码效率。

以上就是几种常见的音频编码格式和编码方式的介绍。在实际的音频处理中，我们需要根据具体的需求，如音质要求、数据量限制等，选择合适的音频编码格式和编码方式。

3.3 视频色彩空间：YUV，RGB等

在视频编程中，色彩空间（Color Space）是一个非常重要的概念。它定义了颜色的表示方式，影响了视频的质量和编解码效率。常见的色彩空间有YUV和RGB两种。

3.3.1 YUV色彩空间

YUV色彩空间（YUV Color Space）是一种常用于视频编程的色彩空间。它将颜色分解为亮度（Y）和色度（UV）两部分。这种分解方式的优点是能够更有效地压缩视频数据，因为人眼对亮度的敏感度远高于色度，所以在视频编码时，可以对色度信息进行更大程度的压缩，而不会明显影响视觉效果。

YUV色彩空间有多种变体，如YUV420，YUV422，YUV444等，这些变体主要区别在于色度的采样方式和采样率。

3.3.2 RGB色彩空间

RGB色彩空间（RGB Color Space）是另一种常用的色彩空间，它将颜色分解为红色（R），绿色（G）和蓝色（B）三个基本颜色分量。RGB色彩空间常用于计算机图形和图像处理中，因为它与人眼的感知方式相近，可以直接和直观地表示颜色。

RGB色彩空间的一个重要特性是它可以表示出非常丰富和精确的颜色，但这也意味着它需要更多的数据来表示颜色，因此在视频编码时，通常会将RGB色彩空间转换为YUV色彩空间，以实现更高效的压缩。

3.3.3 YUV与RGB的转换

在视频编程中，我们经常需要在YUV和RGB两种色彩空间之间进行转换。这种转换可以通过一组线性方程来实现。例如，从YUV到RGB的转换可以通过以下方程来实现：

R = Y + 1.13983 * V
G = Y - 0.39465 * U - 0.58060 * V
B = Y + 2.03211 * U

这里的Y，U，V是YUV色彩空间的分量.

3.3.4 YUV与RGB的应用

在实际的视频编程中，YUV和RGB色彩空间的应用非常广泛。例如，在JPEG图像压缩标准中，就使用了YUV色彩空间来实现高效的图像压缩[1]。在移动设备的摄像头中，也会使用YUV色彩空间来实现高动态范围和低光照下的图像拍摄[2]。此外，还有一些方法可以实现快速的图像和视频的上采样，这些方法通常也会使用YUV或RGB色彩空间[3]。

在视频监控系统中，也会使用YUV和RGB色彩空间来进行对象的跟踪和分类[4]。在数据并行架构中，YUV和RGB色彩空间的转换也是一个重要的操作，可以实现高效的条件操作[5]。

以上就是对YUV和RGB色彩空间在视频编程中的应用的一些介绍。在实际的编程中，我们需要根据具体的需求和环境，选择合适的色彩空间，以实现高效和高质量的视频处理。

参考文献：

4. 音视频流处理中的关键术语（Key Terminology in Audio and Video Streaming）

4.1 流媒体协议：RTMP，HLS等

流媒体协议（Streaming Protocols）是音视频流处理中的核心概念，它规定了音视频数据如何在网络中传输。常见的流媒体协议有RTMP（Real Time Messaging Protocol，实时消息传输协议）和HLS（HTTP Live Streaming，HTTP直播流）等。

RTMP（Real Time Messaging Protocol，实时消息传输协议）

RTMP是由Adobe公司开发的一种设计用来进行实时数据通信的网络协议，主要用来在Flash/AIR平台上进行音视频和数据传输。RTMP基于TCP，保证了数据的高效可靠传输。

RTMP协议主要有三种变体：

RTMP：基于TCP的，使用端口1935，提供持久连接，实现数据的实时通信。
RTMPT：RTMP Tunneling，是RTMP的HTTP封装，可以穿越防火墙，使用端口80。
RTMPS：RTMP over SSL，是RTMP的SSL封装，提供了更好的安全性。

RTMP协议的主要优点是低延迟，实时性强，适合用于直播等需要实时交互的场景。但缺点是需要特殊的服务器支持（如FMS，Nginx-rtmp-module等），并且由于基于TCP，所以在网络条件较差的情况下可能会出现卡顿。

HLS（HTTP Live Streaming，HTTP直播流）

HLS是由Apple公司提出的基于HTTP的流媒体网络传输协议。它的工作原理是将整个流分成一个个小的基于HTTP的文件来下载，每次下载的只是整个视频的一小部分片段，这样可以使播放器在下载整个文件的时候就可以播放。

HLS的主要优点是由于基于HTTP，因此可以通过CDN进行分发，易于扩展，且兼容性好，几乎所有的设备和平台都支持。并且由于HLS有自适应的特性，可以根据网络状况自动选择合适的码率进行播放，因此在网络条件较差的情况下依然可以保持流畅。但缺点是延迟相对较高，一般在10秒以上，不适合实时交互的场景。

在音视频编程中，我们需要根据具体的应用场景和需求，选择合适的流媒体协议。例如，如果我们需要实现低延迟的直播，

4.1.1 RTMP（实时消息传输协议）

RTMP（Real Time Messaging Protocol，实时消息传输协议）是由Adobe公司开发的一种设计用来进行实时数据通信的网络协议，主要用来在Flash/AIR平台上进行音视频和数据传输。RTMP基于TCP，保证了数据的高效可靠传输。

RTMP协议主要有三种变体：

RTMP：基于TCP的，使用端口1935，提供持久连接，实现数据的实时通信。
RTMPT：RTMP Tunneling，是RTMP的HTTP封装，可以穿越防火墙，使用端口80。
RTMPS：RTMP over SSL，是RTMP的SSL封装，提供了更好的安全性。

4.1.2 HLS（HTTP直播流）

HLS（HTTP Live Streaming，HTTP直播流）是由Apple公司提出的基于HTTP的流媒体网络传输协议。它的工作原理是将整个流分成一个个小的基于HTTP的文件来下载，每次下载的只是整个视频的一小部分片段，这样可以使播放器在下载整个文件的时候就可以播放。

HLS的主要优点是由于基于HTTP，因此可以通过CDN进行分发，易于扩展，且兼容性好，几乎所有的设备和平台都支持。并且由于HLS有自适应的特性，可以根据网络状况自动选择合适的码率进行播放，因此在网络条件较差的情况下依然可以保持流畅。但缺点是延迟相对较高，一般在10秒以上，不适合实时交互的场景。[²]

在音视频编程中，我们需要根据具体的应用场景和需求，选择合适的流媒体协议。例如，如果我们需要实现低延迟的直播，可能会选择RTMP协议；而如果我们需要实现大规模的视频点播，可能会选择HLS协议。

4.1.3 音频格式：PCM，AAC等

音频格式（Audio Formats）是指音频数据的编码和存储方式。常见的音频格式有PCM（Pulse Code Modulation，脉冲编码调制）和AAC（Advanced Audio Coding，高级音频编码）等。

PCM（Pulse Code Modulation，脉冲编码调制）

PCM是一种数字音频编码格式，它将模拟信号转换为数字信号。PCM编码过程包括采样、量化和编码三个步骤。PCM是无损音频格式，即编码和解码过程中不会丢失音频信息，因此音质较好，但文件大小较大。

AAC（Advanced Audio Coding，高级音频编码）

AAC是一种有损音频编码格式，由MPEG组织开发。AAC相比于MP3，提供了更高的音质和更低的比特率。AAC广泛应用于各种设备和服务中，如iPhone、YouTube等。

4.1.4 视频格式：H.264，VP9等

视频格式（Video Formats）是指视频数据的编码和存储方式。常见的视频格式有H.264和VP9等。

H.264

H.264，也被称为MPEG-4 Part 10，是一种广泛使用的视频压缩编码格式。H.264提供了高质量的视频和相对较低的比特率，被广泛应用于各种场景，如网络视频、视频会议、数字电视等。

VP9

VP9是由Google开发的一种开源视频编码格式。VP9相比于H.264，提供了更高的压缩效率和更低的比特率，但编码和解码的复杂度也更高。VP9被广泛应用于各种在线视频服务，如YouTube[³]。

在音视频编程中，我们需要根据具体的应用场景和需求，选择合适的音频和视频格式。例如，如果我们需要实现高质量的音频播放，可能会选择PCM音频格式；而如果我们需要实现大规模的视频点播，可能会选择H.264或VP9视频格式

音视频编程ffmepg中的关键术语与概念：深度解析与实践（二）https://developer.aliyun.com/article/1465229

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

音视频编程ffmepg中的关键术语与概念：深度解析与实践（一）

1. 音视频编程基础（Basics of Audio and Video Programming）

1.1 音频和视频的基本概念（Basic Concepts of Audio and Video）

音频（Audio）

视频（Video）

1.2 音频编程关键术语和概念（Key Terms and Concepts in Audio Programming）

立体声（Stereo）

多声道（Multichannel）

采样格式（Sample Format）

1.3 视频编程关键术语和概念（Key Terms and Concepts in Video Programming）

编码格式（Codec Format）

色彩空间（Color Space）

2. 音频编程中的关键术语（Key Terminology in Audio Programming）

2.1 立体声（Stereo）和多声道（Multichannel）解析

立体声（Stereo）

多声道（Multichannel）

2.2 音频采样格式（Audio Sample Formats）

脉冲编码调制（Pulse Code Modulation, PCM）

浮点采样格式（Floating-Point Sample Formats）

2.3 音频采样率和位深（Sampling Rate and Bit Depth）

音频采样率（Sampling Rate）

音频位深（Bit Depth）

3. 视频编程中的关键术语（Key Terminology in Video Programming）

3.1 视频分辨率：SD，HD，4K等

3.1.1 SD（Standard Definition，标清）

3.1.2 HD（High Definition，高清）

3.1.3 Full HD（Full High Definition，全高清）

3.1.4 2K

3.1.5 4K

3.1.6 8K

3.2 音频格式和编码

3.2.1 PCM (Pulse Code Modulation，脉冲编码调制)

3.2.2 FLAC (Free Lossless Audio Codec，自由无损音频编解码器)

3.2.3 MP3 (MPEG-1 Audio Layer III)

3.2.4 AAC (Advanced Audio Coding)

3.3 视频色彩空间：YUV，RGB等

3.3.1 YUV色彩空间

3.3.2 RGB色彩空间

3.3.3 YUV与RGB的转换

3.3.4 YUV与RGB的应用

4. 音视频流处理中的关键术语（Key Terminology in Audio and Video Streaming）

4.1 流媒体协议：RTMP，HLS等

RTMP（Real Time Messaging Protocol，实时消息传输协议）

HLS（HTTP Live Streaming，HTTP直播流）

4.1.1 RTMP（实时消息传输协议）

4.1.2 HLS（HTTP直播流）

4.1.3 音频格式：PCM，AAC等

PCM（Pulse Code Modulation，脉冲编码调制）

AAC（Advanced Audio Coding，高级音频编码）

4.1.4 视频格式：H.264，VP9等

H.264

VP9

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像