FFmpeg开发笔记(十七)Windows环境给FFmpeg集成字幕库libass

本文涉及的产品
视觉智能开放平台,图像通用资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频通用资源包5000点
简介: 在Windows环境下为FFmpeg集成字幕渲染库libass涉及多个步骤,包括安装freetype、libxml2、gperf、fontconfig、fribidi、harfbuzz和libass。每个库的安装都需要下载源码、配置、编译和安装,并更新PKG_CONFIG_PATH环境变量。最后,重新配置并编译FFmpeg以启用libass及相关依赖。完成上述步骤后,通过`ffmpeg -version`确认libass已成功集成。

​libass是一个适用于ASS和SSA格式(Advanced Substation Alpha/Substation Alpha)的字幕渲染器,支持的字幕类型包括srt、ass等,凡是涉及到给视频画面添加字幕,均需事先集成libass。

《FFmpeg开发实战:从零基础到短视频上线》一书的“7.3.1 Linux环境安装libass”介绍了如何在Linux环境给FFmpeg集成libass,其实在Windows环境也能给FFmpeg集成libass,具体的集成步骤说明如下。注意:下列的所有命令均需在MSYS窗口中执行。

1、安装freetype

fontconfig、fribidi、harfbuzz、libass都依赖于freetype库,所以要先安装该库。freetype的安装步骤说明如下。
(1)freetype的下载页面是 https://download.savannah.gnu.org/releases/freetype/ ,比如2023年8月发布的freetype-2.13.2,该版本的源码下载地址是 https://download.savannah.gnu.org/releases/freetype/freetype-2.13.2.tar.gz

tar zxvf freetype-2.13.2.tar.gz
cd freetype-2.13.2

(2)进入解压后的freetype目录,运行下面命令配置freetype。

./configure --prefix=/usr/local/freetype

(3)运行下面命令编译freetype。

make

(4)编译完成后,运行下面命令安装freetype。

make install

(5)给环境变量PKG_CONFIG_PATH添加freetype的pkgconfig路径,也就是在/etc/profile文件末尾添加如下一行内容:

export PKG_CONFIG_PATH=/usr/local/freetype/lib/pkgconfig:$PKG_CONFIG_PATH

然后执行下面命令重新加载环境变量:

source /etc/profile

执行下面命令查看当前的环境变量,发现PKG_CONFIG_PATH的修改已经奏效。

env | grep PKG_CONFIG_PATH

2、安装libxml2

由于字体配置库fontconfig依赖于libxml2库,因此要先安装该库。libxml2的安装步骤说明如下。
(1)libxml2的下载页面是 http://xmlsoft.org/sources/ ,比如2010年11月发布的libxml2-2.7.8,该版本的源码下载地址是 http://xmlsoft.org/sources/libxml2-2.7.8.tar.gz 。执行下面命令解压下载好的压缩包:

tar zxvf libxml2-2.7.8.tar.gz
cd libxml2-2.7.8

(2)修改include/libxml/xmlexports.h,在文件开头增加下面一行:

#define LIBXML_STATIC

(3)进入解压后的libxml2目录,运行下面命令配置libxml2。

./configure --prefix=/usr/local/libxml2

(4)运行下面命令编译libxml2。

make

(5)编译完成后,运行下面命令安装libxml2。

make install

(6)给环境变量PKG_CONFIG_PATH添加libxml2的pkgconfig路径,也就是在/etc/profile文件末尾添加如下一行内容:

export PKG_CONFIG_PATH=/usr/local/libxml2/lib/pkgconfig:$PKG_CONFIG_PATH

然后执行下面命令重新加载环境变量:

source /etc/profile

执行下面命令查看当前的环境变量,发现PKG_CONFIG_PATH的修改已经奏效。

env | grep PKG_CONFIG_PATH

3、安装gperf

由于字体配置库fontconfig依赖于gperf,因此要先安装该工具。Windows环境运行下面命令安装gperf:

pacman -S gperf

4、安装fontconfig

fontconfig是一款字体配置工具,它能够自动检测字库,以及管理和配置字库。fontconfig的安装步骤说明如下。
(1)fontconfig的下载页面是 https://www.freedesktop.org/software/fontconfig/release/ ,比如2023年1月发布的fontconfig-2.14.2,该版本的源码下载地址是 https://www.freedesktop.org/software/fontconfig/release/fontconfig-2.14.2.tar.gz 。执行下面命令解压下载好的压缩包:

tar zxvf fontconfig-2.14.2.tar.gz
cd fontconfig-2.14.2

(2)进入解压后的fontconfig目录,运行下面命令配置fontconfig。

./configure --prefix=/usr/local/fontconfig --enable-libxml2 --disable-docs

注意:如果没安装libxml2,运行configure就会报错“* expat is required. or try to use --enable-libxml2”。
(3)运行下面命令编译fontconfig。

make

(4)编译完成后,运行下面命令安装fontconfig。

make install

(5)给环境变量PKG_CONFIG_PATH添加fontconfig的pkgconfig路径,也就是在/etc/profile文件末尾添加如下一行内容:

export PKG_CONFIG_PATH=/usr/local/fontconfig/lib/pkgconfig:$PKG_CONFIG_PATH

然后执行下面命令重新加载环境变量:

source /etc/profile

执行下面命令查看当前的环境变量,发现PKG_CONFIG_PATH的修改已经奏效。

env | grep PKG_CONFIG_PATH

5、安装fribidi

fribidi是个中东字体增强库,它实现了Unicode字符集的双向算法,以便处理阿拉伯语、希伯来语这些中东语言。fribidi的安装步骤说明如下。
(1)fribidi的下载页面是 https://github.com/fribidi/fribidi/releases ,比如2023年5月发布的fribidi-1.0.13,该版本的源码下载地址是 https://github.com/fribidi/fribidi/releases/download/v1.0.13/fribidi-1.0.13.tar.xz 。注意要下载扩展名是tar.xz的压缩包,不能下载扩展名是tar.gz的压缩包,因为tar.gz里面没有configure文件。执行下面命令解压下载好的压缩包:

tar xvf fribidi-1.0.13.tar.xz
cd fribidi-1.0.13

(2)进入解压后的fribidi目录,运行下面命令配置fribidi。

./configure --prefix=/usr/local/fribidi

(3)运行下面命令编译fribidi。

make

(4)编译完成后,运行下面命令安装fribidi。

make install

(5)给环境变量PKG_CONFIG_PATH添加fribidi的pkgconfig路径,也就是在/etc/profile文件末尾添加如下一行内容:

export PKG_CONFIG_PATH=/usr/local/fribidi/lib/pkgconfig:$PKG_CONFIG_PATH

然后执行下面命令重新加载环境变量:

source /etc/profile

执行下面命令查看当前的环境变量,发现PKG_CONFIG_PATH的修改已经奏效。

env | grep PKG_CONFIG_PATH

6、安装harfbuzz

harfbuzz是一个文本塑形引擎,它能够将Unicode字符转换为格式正确的字形输出,可用于调试和预览字体效果。harfbuzz的安装步骤说明如下。
(1)harfbuzz的最新源码在 https://github.com/harfbuzz/harfbuzz ,但是高版本harfbuzz容易编译失败,实际应用采取1.2.7版本就够了。各版本harfbuzz的下载页面是 https://www.freedesktop.org/software/harfbuzz/release/ ,比如1.2.7版本的源码下载地址是 https://www.freedesktop.org/software/harfbuzz/release/harfbuzz-1.2.7.tar.bz2 。执行下面命令解压下载好的压缩包:

tar xvf harfbuzz-1.2.7.tar.bz2
cd harfbuzz-1.2.7

(2)进入解压后的harfbuzz目录,运行下面命令配置harfbuzz。

./configure --prefix=/usr/local/harfbuzz --disable-gtk-doc

(3)运行下面命令编译harfbuzz。

make

(4)编译完成后,运行下面命令安装harfbuzz。

make install

(5)给环境变量PKG_CONFIG_PATH添加harfbuzz的pkgconfig路径,也就是在/etc/profile文件末尾添加如下一行内容:

export PKG_CONFIG_PATH=/usr/local/harfbuzz/lib/pkgconfig:$PKG_CONFIG_PATH

然后执行下面命令重新加载环境变量:

source /etc/profile

执行下面命令查看当前的环境变量,发现PKG_CONFIG_PATH的修改已经奏效。

env | grep PKG_CONFIG_PATH

7、安装libass

确认以上的freetype、libxml2、gperf、fontconfig、fribidi、harfbuzz等库全都正确安装之后,再来安装字幕渲染器libass。libass的安装步骤说明如下。
(1)libass的源码页面是 https://github.com/libass/libass ,下载页面是 https://github.com/libass/libass/releases ,比如2023年2月发布的libass-0.17.1,该版本的源码下载地址是 https://github.com/libass/libass/releases/download/0.17.1/libass-0.17.1.tar.gz 。执行下面命令解压下载好的压缩包:

tar zxvf libass-0.17.1.tar.gz
cd libass-0.17.1

(2)进入解压后的libass目录,运行下面命令配置libass。

./configure --prefix=/usr/local/libass

(3)运行下面命令编译libass。

make

(4)编译完成后,运行下面命令安装libass。

make install

(5)给环境变量PKG_CONFIG_PATH添加libass的pkgconfig路径,也就是在/etc/profile文件末尾添加如下一行内容:

export PKG_CONFIG_PATH=/usr/local/libass/lib/pkgconfig:$PKG_CONFIG_PATH

然后执行下面命令重新加载环境变量:

source /etc/profile

执行下面命令查看当前的环境变量,发现PKG_CONFIG_PATH的修改已经奏效。

env | grep PKG_CONFIG_PATH

8、启用libass

由于FFmpeg默认未启用libass,因此需要重新配置FFmpeg,标明启用libass,然后重新编译安装FFmpeg。FFmpeg的Windows环境完整编译过程参见《FFmpeg开发实战:从零基础到短视频上线》一书的“8.1 Windows环境编译FFmpeg”,详细的启用步骤说明如下。
(1)确保下列路径均已加载至环境变量PKG_CONFIG_PATH

export PKG_CONFIG_PATH=/usr/local/freetype/lib/pkgconfig:$PKG_CONFIG_PATH
export PKG_CONFIG_PATH=/usr/local/libxml2/lib/pkgconfig:$PKG_CONFIG_PATH
export PKG_CONFIG_PATH=/usr/local/fontconfig/lib/pkgconfig:$PKG_CONFIG_PATH
export PKG_CONFIG_PATH=/usr/local/fribidi/lib/pkgconfig:$PKG_CONFIG_PATH
export PKG_CONFIG_PATH=/usr/local/harfbuzz/lib/pkgconfig:$PKG_CONFIG_PATH
export PKG_CONFIG_PATH=/usr/local/libass/lib/pkgconfig:$PKG_CONFIG_PATH

(2)执行以下命令,在libxml2的安装路径下补充一个xmlversion.h,因为配置FFmpeg的时候会检查。

mkdir -p /usr/local/libxml2/include/libxml2/libxml2/libxml
cp /usr/local/libxml2/include/libxml2/libxml/xmlversion.h /usr/local/libxml2/include/libxml2/libxml2/libxml/xmlversion.h

(3)回到FFmpeg源码的目录,执行以下命令重新配置FFmpeg,主要增加启用libass。(增加了选项--enable-libass --enable-libfribidi --enable-libxml2 --enable-fontconfig)

./configure  --prefix=/usr/local/ffmpeg --arch=x86_64 --enable-shared --disable-static --disable-doc --enable-libx264 --enable-libx265 --enable-libxavs2 --enable-libdavs2 --enable-libmp3lame --enable-gpl --enable-nonfree --enable-libfreetype --enable-sdl2 --enable-libvorbis --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-version3 --enable-libopus --enable-libvpx --enable-libass --enable-libfribidi --enable-libxml2 --enable-fontconfig --enable-openssl --enable-iconv --enable-zlib --extra-cflags='-I/usr/local/lame/include -I/usr/local/libogg/include -I/usr/local/amr/include' --extra-ldflags='-L/usr/local/lame/lib -L/usr/local/libogg/lib -L/usr/local/amr/lib' --cross-prefix=x86_64-w64-mingw32- --target-os=mingw32

(4)运行下面命令编译FFmpeg。

make clean
make -j4

(5)执行下面命令安装FFmpeg。

make install
mv /usr/local/ffmpeg/bin/*.lib /usr/local/ffmpeg/lib/
cp /usr/local/libxml2/bin/*.dll /usr/local/ffmpeg/bin
cp /usr/local/freetype/bin/*.dll /usr/local/ffmpeg/bin
cp /usr/local/fontconfig/bin/*.dll /usr/local/ffmpeg/bin
cp /usr/local/fribidi/bin/*.dll /usr/local/ffmpeg/bin
cp /usr/local/harfbuzz/bin/*.dll /usr/local/ffmpeg/bin
cp /usr/local/libass/bin/*.dll /usr/local/ffmpeg/bin

(6)运行以下命令查看FFmpeg的版本信息。

ffmpeg -version

查看控制台回显的FFmpeg版本信息,找到“--enable-libass”,说明FFmpeg正确启用了字幕渲染器libass。

目录
相关文章
|
2月前
|
XML 测试技术 API
利用C#开发ONVIF客户端和集成RTSP播放功能
利用C#开发ONVIF客户端和集成RTSP播放功能
1373 123
|
4月前
|
数据采集 运维 DataWorks
DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破
智能驾驶数据预处理面临数据孤岛、任务爆炸与开发运维一体化三大挑战。DataWorks提供一站式的解决方案,支持千万级任务调度、多源数据集成及全链路数据开发,助力智能驾驶模型数据处理与模型训练高效落地。
|
7月前
|
监控 Java API
1K star!这个开源项目让短信集成简单到离谱,开发效率直接翻倍!
SMS4J 是一款由国内技术团队打造的短信聚合框架,专为解决多短信服务商接入难题而生。它就像短信界的"瑞士军刀",目前已整合21家主流短信服务商,从阿里云、腾讯云到中国移动云MAS,开发者只需通过简单配置即可实现多平台无缝切换。
464 4
|
4月前
|
IDE Ubuntu Java
在Ubuntu18.04安装兼容JDK 8的Eclipse集成开发环境的指南。
完成以上步骤后,您将在Ubuntu 18.04系统上成功安装并配置了Eclipse IDE,它将与JDK 8兼容,可以开始进行Java开发工作。如果遇到任何问题,请确保每一步骤都正确执行,并检查是否所有路径都与您的具体情况相匹配。
213 11
|
6月前
|
人工智能 安全 Shell
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
Jupyter MCP服务器基于模型上下文协议(MCP),实现大型语言模型与Jupyter环境的无缝集成。它通过标准化接口,让AI模型安全访问和操作Jupyter核心组件,如内核、文件系统和终端。本文深入解析其技术架构、功能特性及部署方法。MCP服务器解决了传统AI模型缺乏实时上下文感知的问题,支持代码执行、变量状态获取、文件管理等功能,提升编程效率。同时,严格的权限控制确保了安全性。作为智能化交互工具,Jupyter MCP为动态计算环境与AI模型之间搭建了高效桥梁。
456 2
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
|
5月前
|
监控 安全 Java
Java 开发中基于 Spring Boot 3.2 框架集成 MQTT 5.0 协议实现消息推送与订阅功能的技术方案解析
本文介绍基于Spring Boot 3.2集成MQTT 5.0的消息推送与订阅技术方案,涵盖核心技术栈选型(Spring Boot、Eclipse Paho、HiveMQ)、项目搭建与配置、消息发布与订阅服务实现,以及在智能家居控制系统中的应用实例。同时,详细探讨了安全增强(TLS/SSL)、性能优化(异步处理与背压控制)、测试监控及生产环境部署方案,为构建高可用、高性能的消息通信系统提供全面指导。附资源下载链接:[https://pan.quark.cn/s/14fcf913bae6](https://pan.quark.cn/s/14fcf913bae6)。
953 0
|
7月前
|
IDE 开发工具
TeaScript IDE集成开发环境
TeaScriptIDE 是一款功能丰富的集成开发环境,包含代码编辑器(语法着色提升可读性)、调试器(显示运行结果)、内置函数帮助文档、打包功能(生成单个可执行文件)以及保存/恢复最近文件的功能。其界面由菜单栏、工具栏、多标签页编辑窗口、控制台输出窗口和状态栏组成,支持快速命令调用、程序运行结果显示及错误信息提示。退出时会自动保存状态,下次启动可继续编辑上次打开的文件。
188 15
|
Linux 开发工具 Android开发
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
ijkplayer是由Bilibili基于FFmpeg3.4研发并开源的播放器,适用于Android和iOS,支持本地视频及网络流媒体播放。本文详细介绍如何在新版Android Studio中导入并使用ijkplayer库,包括Gradle版本及配置更新、导入编译好的so文件以及添加直播链接播放代码等步骤,帮助开发者顺利进行App调试与开发。更多FFmpeg开发知识可参考《FFmpeg开发实战:从零基础到短视频上线》。
1303 2
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
|
编解码 语音技术 内存技术
FFmpeg开发笔记(五十八)把32位采样的MP3转换为16位的PCM音频
《FFmpeg开发实战:从零基础到短视频上线》一书中的“5.1.2 把音频流保存为PCM文件”章节介绍了将媒体文件中的音频流转换为原始PCM音频的方法。示例代码直接保存解码后的PCM数据,保留了原始音频的采样频率、声道数量和采样位数。但在实际应用中,有时需要特定规格的PCM音频。例如,某些语音识别引擎仅接受16位PCM数据,而标准MP3音频通常采用32位采样,因此需将32位MP3音频转换为16位PCM音频。
372 0
FFmpeg开发笔记(五十八)把32位采样的MP3转换为16位的PCM音频

热门文章

最新文章