使用python moviepy提取视频中的音频,同时对音频数据进行数据可视化分析

简介: 使用python moviepy提取视频中的音频,同时对音频数据进行数据可视化分析

@toc

1 使用moviepy库包提取音频

1.1 moviepy库包说明

1、moviepy库包介绍

MoviePy是一个用于视频编辑的Python模块,它可以用于基本操作(如剪切、连接、标题插入)、视频合成(也称为非线性编辑)、视频处理,或创建高级效果。它可以读写最常见的视频格式,包括GIF。

2、moviepy参考文档

1.2 安装moviepy

直接使用pip安装即可:

pip install moviepy -i https://pypi.tuna.tsinghua.edu.cn/simple

1.2 使用moviepy提取视频中的音频

# 1、使用moviepy模块 提取视频中的音频文件
from moviepy.editor import AudioFileClip

my_audio_clip = AudioFileClip("./test.mp4")
print(type(my_audio_clip))  # <class 'moviepy.audio.io.AudioFileClip.AudioFileClip'>

#  提取视频中的音频文件  m4v,mp3等音频格式也是支持的
my_audio_clip.write_audiofile("./extract_audio.wav")
'''
MoviePy - Writing audio in ./extract_audio.wav
MoviePy - Done.
'''

2 使用librosa库包读取音频文件,并分析音频文件

2.1 librosa库包介绍

1、librosa是一个用于音乐音频分析的python包。它提供了创建音乐信息检索系统所必需的构建模块。

2、librosa参考文档

2.2 使用librosa读取音频文件,并分析音频文件

音频数据内容,可以认为记录了:采样频率 和 每个采样点的信号强度 两个部分构成一个音频文件

数据流可以理解为一个数组,按照字节存储

# 2、使用librosa分析音频
import librosa
import numpy as np

# 加载音频文件
audio, freq = librosa.load("./extract_audio.wav")
print(f"audio: {audio} and audio shape: {audio.shape}\nfreq: {freq}")
print(f"audio type: {type(audio)}\nfreq type: {type(freq)}")

time = len(audio) / freq
print(time)  # 94.3
'''
audio: [ 0.          0.          0.         ... -0.00216522 -0.00011788
 -0.00167476] and audio shape: (2079315,)
freq: 22050
audio type: <class 'numpy.ndarray'>
freq type: <class 'int'>


# 上面的这段音频 采样点共:2079315   采样频率为:22050
这段音频的时长为:2079315 / 22050 = 94.3   因此这段音频的时长约为94秒
也就是每秒采样 22050个数据
'''

上面有几个概念:

  • 音频采样点:就是在一段时间内,一共采集了多少个音频数据
  • 音频采样频率:就是在一秒内采样采样多少个采样点

因此可以根据音频采样点和音频采样频率,计算出音频的时长:

$$音频的时长 = \frac{音频采样点个数}{音频采样频率}$$

3 绘制音频信号的强度图

3.1 使用matplotlib绘制音频信号强度图

# 3、画出音频的信号强度图
import matplotlib.pyplot as plt

time = np.arange(0, len(audio)) / freq
# np.arange(0, len(audio))  = (0,1,2,3,...,2079314)
print(time.shape)  # (2079315,)
print(np.min(time), np.max(time))  # 94.29995464852608  0.0

fig, ax = plt.subplots()
ax.plot(time, audio)
ax.set(xlabel="Time(s)", ylabel="Sound Amplitude")
plt.show()
# 其实绘制的点一共有2079315个,但是由于我们的时间范围是0-94,因此音频信号看起来很拥挤

image.png

3.2 使用librosa画信号强度图

当然我们可以使用librosa 库的工具来分析,可以修掉音频首尾的其他信息,画信号强度图的方式如下:

# 4、使用librosa画信号强度图
# 当然我们可以使用 librosa 库的工具来分析,可以修掉音频首尾的其他信息,画信号强度图的方式如下:
import librosa.display

audio, _ = librosa.effects.trim(audio)
librosa.display.waveplot(audio, sr=freq)
plt.show()

image.png

完整代码如下:

__Author__ = "Shliang"
__Email__ = "shliang0603@gmail.com"


# 1、使用moviepy模块 提取视频中的音频文件
from moviepy.editor import AudioFileClip

my_audio_clip = AudioFileClip("./test.mp4")
print(type(my_audio_clip))  # <class 'moviepy.audio.io.AudioFileClip.AudioFileClip'>

#  提取视频中的音频文件  m4v,mp3等音频格式也是支持的
# my_audio_clip.write_audiofile("./extract_audio.wav")
'''
MoviePy - Writing audio in ./extract_audio.wav
MoviePy - Done.
'''

# 2、使用librosa分析音频
# 音频数据内容,可以认为记录了:采样频率 和 每个采样点的信号强度 两个部分构成一个音频文件
# 数据流可以理解为一个数组,按照字节存储
import librosa
import numpy as np

# 加载音频文件
audio, freq = librosa.load("./extract_audio.wav")
print(f"audio: {audio} and audio shape: {audio.shape}\nfreq: {freq}")
print(f"audio type: {type(audio)}\nfreq type: {type(freq)}")

time = len(audio) / freq
print(time)  # 94.3
'''
audio: [ 0.          0.          0.         ... -0.00216522 -0.00011788
 -0.00167476] and audio shape: (2079315,)
freq: 22050
audio type: <class 'numpy.ndarray'>
freq type: <class 'int'>


# 上面的这段音频 采样点共:2079315   采样频率为:22050
这段音频的时长为:2079315 / 22050 = 94.3   因此这段音频的时长约为94秒
也就是每秒采样 22050个数据

'''


# 3、画出音频的信号强度图
import matplotlib.pyplot as plt

time = np.arange(0, len(audio)) / freq
# np.arange(0, len(audio))  = (0,1,2,3,...,2079314)
print(time.shape)  # (2079315,)
print(np.min(time), np.max(time))  # 94.29995464852608  0.0

fig, ax = plt.subplots()
ax.plot(time, audio)
ax.set(xlabel="Time(s)", ylabel="Sound Amplitude")
plt.show()
# 其实绘制的点一共有2079315个,但是由于我们的时间范围是0-94,因此音频信号看起来很拥挤


# 4、使用librosa画信号强度图
# 当然我们可以使用 librosa 库的工具来分析,可以修掉音频首尾的其他信息,画信号强度图的方式如下:
import librosa.display

audio, _ = librosa.effects.trim(audio)
librosa.display.waveplot(audio, sr=freq)
plt.show()
目录
相关文章
|
15天前
|
存储 分布式计算 大数据
基于Python大数据的的电商用户行为分析系统
本系统基于Django、Scrapy与Hadoop技术,构建电商用户行为分析平台。通过爬取与处理海量用户数据,实现行为追踪、偏好分析与个性化推荐,助力企业提升营销精准度与用户体验,推动电商智能化发展。
|
16天前
|
数据可视化 关系型数据库 MySQL
基于python大数据的的海洋气象数据可视化平台
针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。
|
30天前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
682 1
|
2月前
|
数据采集 Web App开发 自然语言处理
新闻热点一目了然:Python爬虫数据可视化
新闻热点一目了然:Python爬虫数据可视化
|
1月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
260 0
|
23天前
|
JSON 算法 API
Python采集淘宝商品评论API接口及JSON数据返回全程指南
Python采集淘宝商品评论API接口及JSON数据返回全程指南
|
1月前
|
JSON API 数据安全/隐私保护
Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南
通过以上流程,可实现淘宝拍立淘按图搜索的完整调用链路,并获取结构化的JSON商品数据,支撑电商比价、智能推荐等业务场景。
|
14天前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
15天前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。