音视频基础知识

简介: 音视频基础知识

音视频基础知识涵盖了与音频和视频相关的概念、技术和术语。以下是一些关于音视频的基础知识:

视频基础知识:

由于人类眼睛的特殊结构,画面快速切换时,画面会有残留,感觉起来就是连贯的动作。所以,视频就是由一系列图片构成的。

1.帧率

帧率表示每秒显示的图像帧数,通常以帧每秒(FPS)为单位。标准电影通常以 24 FPS 播放,而标准电视通常以 30 FPS(美国)或 25 FPS(欧洲)播放。

2.分辨率

视频的分辨率表示图像的宽度和高度(例如,1920x1080 表示高清视频)。更高的分辨率通常意味着更清晰的图像。

3.刷新率

刷新率是指屏幕每秒画面被刷新的次数。

4.编码格式

编码的目的是压缩数据量,采用编码算法压缩冗余数据,常见的编码格式有下面这两个

  • MPEG(MPEG-2,MPEG-4)
  • H.26X(H.263、H.264/AVC、H.265/HEVC)
5.码率

码率也就是比特率,比特率表示每秒传输的视频数据量,通常以千比特每秒(kbps)或兆比特每秒(Mbps)为单位。比特率越高,宽带消耗得越多。比特(bit)就是二进制里面最小的单位,要么是0,要么是1。

文件大小(b)=码率(b/s)×时长(s)

6.容器格式

容器格式是一种文件格式,可以包含视频、音频、字幕和元数据等多种媒体数据。常见的容器格式包括MP4、AVI、MKV、MOV等。

7.色彩空间
RGB

是一种颜色空间模型,通过对红®、绿(G)、蓝(B)3个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色,RGB即代表红、绿、蓝3种通道的颜色。

YUV

YUV这种色彩空间并不是我们熟悉的,这是一种亮度与色度分离的色彩格式。

Y:亮度,就是灰度值。除了表示亮度信号外,还含有较多的绿色通道量。

U:蓝色通道与亮度的差值。

V:红色通道与亮度的差值。

RGB和YUV的换算

Y = 0.299R + 0.587G + 0.114B

U = -0.147R - 0.289G + 0.436B

V = 0.615R - 0.515G - 0.100B

——————————————————

R = Y + 1.14V

G = Y - 0.39U - 0.58V

B = Y + 2.03U

音频基础知识:

声音是通过振动传播的压力波,而音频是记录和再现声音的电子信号。

1.声波

声音以波的形式传播,具有振幅、频率和相位等特性。振幅决定声音的音量,频率决定声音的音调。

2.采样率

音频信号通过在一定时间间隔内对声音振动进行采样来数字化。采样率表示每秒采集的样本数,通常以赫兹(Hz)为单位,如44.1 kHz。

3.声道

声道是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号,所以声道数也就是声音录制时的音源数量或回放相应的扬声器数量。

常见声道有单声道、立体声道、4声道、5.1声道、7.1声道等,下面分别进行介绍。

单声道:

设置一个扬声器。

立体声道:

把单声道一个扬声器扩展为左右对称的两个扬声器。

4声道:

4声道环绕规定了4个发声点,分别是前左、前右、后左、后右,听众则被包围在中间。

5.1声道:

其实5.1声道系统来源于4.1声道系统,将环绕声道一分为二,分为左环绕和右环绕,中央位置增加重低音效果。

7.1声道:

7.1声道系统在5.1声道系统的基础上又增加了中左和中右两个发音点。

6.编解码器

音频编解码器用于将模拟音频信号转换为数字格式(编码)和将数字音频信号转换回模拟格式(解码)。常见的音频编解码器包括MP3、AAC、WAV等。

目录
相关文章
|
3月前
|
编解码 监控 网络协议
如何用魔法般的步骤实现RTSP推送H.264与H.265(HEVC),打造震撼视听盛宴,让每一帧都充满魔力!
【9月更文挑战第3天】实现RTSP流媒体服务推送H.264和H.265编码视频是现代视频监控及直播平台的关键技术。本文详细介绍环境搭建、编码配置及服务器与客户端实现方法。首先,通过FFmpeg捕获视频并编码成RTSP流,接着使用VLC等工具接收播放。此外,还提供了C++示例代码,演示如何利用libv4l2和FFmpeg自定义服务器端实现。希望本文能帮助读者成功搭建RTSP视频流系统。
434 1
|
4月前
|
API 图形学
Unity精华☀️Audio Mixer终极教程:用《双人成行》讲解它的用途
Unity精华☀️Audio Mixer终极教程:用《双人成行》讲解它的用途
|
4月前
|
编解码 监控 网络协议
【绝密技巧】揭秘!如何用魔法般的步骤实现RTSP推送H.264与H.265(HEVC),打造震撼视听盛宴,让每一帧都充满魔力!
【8月更文挑战第15天】本文详述了如何使用RTSP流媒体服务推送H.264及H.265编码视频,适用于视频监控和直播平台。首先需确保环境支持这两种编码格式,可通过FFmpeg实现。在Ubuntu上安装FFmpeg后,可配置从摄像头捕获视频并推流至RTSP服务器。针对H.265编码,只需更改视频编码器为`libx265`。客户端可使用VLC播放器接收流。此外,还提供了C++示例代码用于自定义服务器实现,包括初始化上下文、打开编码器和循环编码视频帧。此教程旨在助力实现RTSP推送目标。
73 0
|
7月前
|
编解码 vr&ar 计算机视觉
音视频基础
音视频基础
|
7月前
|
存储 编解码 算法
ffmpeg笔记(一)音视频基础
ffmpeg笔记(一)音视频基础
180 0
|
容器
借助开源项目,又好又快的实现视频文件”剧情连拍(剧情截图)”功能
借助开源项目,又好又快的实现视频文件”剧情连拍(剧情截图)”功能
695 0
借助开源项目,又好又快的实现视频文件”剧情连拍(剧情截图)”功能
|
Web App开发 缓存 算法
白话解读 WebRTC 音频 NetEQ 及优化实践
NetEQ 是 WebRTC 音视频核心技术之一,对于提高 VoIP 质量有明显的效果,本文将从更为宏观的视角,用通俗白话介绍 WebRTC 中音频 NetEQ 的相关概念背景和框架原理,以及相关的优化实践。
白话解读 WebRTC 音频 NetEQ 及优化实践