一文读懂Web Codecs API:浏览器背后的媒体魔术师

简介: 一文读懂Web Codecs API:浏览器背后的媒体魔术师

引言

在早期的Web 网页中,视频播放通常要依靠 FlashSilverlight 等插件来完成,浏览器是不支持直接播放视频的。

随着网络技术的发展,视频这种媒体方式的需求变得普遍,HTML5中,出现了一个新的元素Video,使得我们可以不借助插件播放视频。

当然,它并不支持所有的格式,而且不同的浏览器厂商支持的格式也有所不同,为什么会出现只支持部分格式? 在 Web 中,能实现无插件播放的有3GP、 ADTS、Flac、Mpeg-4、Ogg、Mov、WebM等,为什么能播放这些呢?

其实就是浏览器内置了相关的解码器,使得我们可以对其解码播放,反之,没有对应解码器,就无法进行播放。

视频播放的步骤

大致如下:

image.png

当然,我们今天的主角并不是 Video 元素,我们的主角是 Web Codecs Api

什么是 Web Codecs ,顾名思义,就是 Web 中的编码解码器。

对谁编码和解码?对视频和音频

旗下主要有 AudioDecodeVideoDecoderAudioEncoderVideoEncoder 这四大将。

能干啥?能获得到对视频流的单个帧和音频数据块的底层访问能力,实现完全控制媒体。 例子:使用 Web CodecsMP4(H264) 获取数据、解封装播放。

我们所见到的视频文件,里面往往包含视频和音频,视频其实是像幻灯片一样,由一张一张的图像组成。

而视频文件,就是一堆图像数据和音频组合起来的,通过特定的编码压缩,通过特定的协议存储。

反过来可以通过解协议、解封装、解码来进行播放。

第一步:解协议解封装。

image.png

一个MP4视频文件大致由以上部分组成。这里我们使用的是 MP4Box.js 进行解封装。

解封装获取文件的信息后,我们就需要配置解码器,需要用到的解码器有视频解码器和音频解码器,对解码后的数据进行处理就能用于播放。

基本的流程如下:

image.png

代码实现

使用类封装

// 使用MP4 Box 解封装
import Mp4box from 'mp4box'
 
// 非worker模式
 
export default class VideoPlayer {
 // options 暂时只有一个renderCanvas
 constructor(options) {
   // 解码器
   this.$codecs = new Codecs(this.output.bind(this))
   // 渲染器
   this.$render = new Render(options.renderCanvas)
 }
 // 输出
 output(type, data) {
   // 输出
   if(type === 'frame') {
     this.$render.render(data)
   } else {
     this.$render.playAudio(data)
   }
   // 销毁帧
   data.close()
 }
 // 加载文件
 loadFile(file) {
   return new Promise((resolve, reject) => {
     file.arrayBuffer().then((buffer) => {
       buffer.fileStart = 0
       this.$codecs.codecFile(buffer)
       resolve(true)
     }).catch((e) => {
       reject(e)
     })
   })
 }
}

渲染类封装

// 渲染类
class Render {
 constructor(canvas) {
   this.canvas = canvas
   this.ctx = canvas.getContext('2d')
   this.audioCtx = new AudioContext()
   this.audioOutput = this.audioCtx.destination
 
   this.interleavingBuffers = []
   this.trackGenerator = new MediaStreamTrackGenerator({ kind: "audio" });
   this.writer = this.trackGenerator.writable.getWriter()
 
   const audio = document.createElement('audio')
   audio.setAttribute('controls', 'controls')
   document.body.appendChild(audio)
   const mediaStream = new MediaStream([this.trackGenerator]);
   audio.srcObject = mediaStream;
   
 }
 render(frame) {
   const { canvas, ctx } = this
   canvas.width = frame.displayWidth
   canvas.height = frame.displayHeight
   ctx.fillStyle = '#f00'
   ctx.clearRect(0, 0, frame.displayWidth, frame.displayHeight)
   ctx.drawImage(frame, 0, 0, frame.displayWidth, frame.displayHeight)
 }
 playAudio(audioData) {
   this.bufferAudioData(audioData)
 }
 bufferAudioData(audioData) {
   const data = structuredClone(audioData)
   this.writer.write(audioData)
 }
}

解码类封装

class Codecs {
  // 初始化MP4
  public $M: any = Mp4box.createFile();
  constructor(output = (type, frame) => {}) {
    // 初始化
    this.$M.onReady = this.onReady.bind(this);
    this.$M.onSamples = this.onSamples.bind(this);
    // 视频解码器
    this.$videoCodec = new VideoDecoder({
      output(frame: any) {
        output('frame', frame);
      },
      error(e: any) {
        console.error(e);
      },
    });
    // 音频解码器
    this.$audioCodec = new AudioDecoder({
      output: (audioData: any) => {
        output('audioData', audioData);
      },
      error: (e: any) => {
        console.error(e);
      },
    });
  }
  // 当准备好了之后
  onReady(info: any) {
    const videoTrack = info.videoTracks[0];
    const videoConfig = {
      codec: videoTrack.codec,
      codedHeight: videoTrack.video.height,
      codedWidth: videoTrack.video.width,
      description: this.description(videoTrack),
    };
    const audioTrack = info.audioTracks[0];
    const audioConfig = {
      codec: audioTrack.codec,
      sampleRate: 48000,
      numberOfChannels: 2,
      description: this.description(audioTrack),
    };
    // 是否支持编码标准
    VideoDecoder.isConfigSupported(videoConfig).then((res) => {
      this.$videoCodec.configure(videoConfig);
      this.$M.setExtractionOptions(videoTrack.id);
      AudioDecoder.isConfigSupported(audioConfig).then((res) => {
        this.$audioCodec.configure(audioConfig);
        this.$M.setExtractionOptions(audioTrack.id);
        this.$M.start();
      });
    });
  }
  // 获取解码器的描述,才能完整解码
  description(track) {
    const trak = this.$M.getTrackById(track.id);
    console.log('trak', trak);
    for (const entry of trak.mdia.minf.stbl.stsd.entries) {
      if (entry.avcC || entry.hvcC) {
        const stream = new Mp4box.DataStream(
          undefined,
          0,
          Mp4box.DataStream.BIG_ENDIAN
        );
        if (entry.avcC) {
          entry.avcC.write(stream);
        } else {
          entry.hvcC.write(stream);
        }
        return new Uint8Array(stream.buffer, 8); // Remove the box header.
      }
      if (entry.esds) {
        return entry.esds.esd.descs[0].descs[0].data;
      }
    }
    throw 'avcC or hvcC not found';
  }
  // MP4Box 传出的样本
  onSamples(track_id: any, ref: any, samples: any) {
    if (track_id === 2) {
      this.decodeAudio(samples);
    } else {
      this.decodeVideo(samples);
    }
  }
  // 解码视频
  decodeVideo(samples) {
    for (const sample of samples) {
      const data = new EncodedVideoChunk({
        type: sample.is_sync ? 'key' : 'delta',
        timestamp: (1e6 * sample.cts) / sample.timescale,
        duration: (1e6 * sample.duration) / sample.timescale,
        data: sample.data,
      });
      this.$videoCodec.decode(data);
    }
  }
  // 解码音频
  decodeAudio(samples) {
    for (const sample of samples) {
      const data = new EncodedAudioChunk({
        type: sample.is_sync ? 'key' : 'delta',
        timestamp: (1e6 * sample.cts) / sample.timescale,
        duration: (1e6 * sample.duration) / sample.timescale,
        data: sample.data,
      });
      this.$audioCodec.decode(data);
    }
  }
  // 开始解码
  codecFile(file: File | ArrayBuffer) {
    if (file instanceof File) {
      file.arrayBuffer().then((buffer) => {
        this.$M.appendBuffer(buffer);
        this.$M.flush();
      });
    } else if (file instanceof ArrayBuffer) {
      this.$M.appendBuffer(file);
      this.$M.flush();
    }
  }
}

以上就是 Web Codes Api 的一个小案例,实现了基本的解码播放。



目录
打赏
0
0
0
0
41
分享
相关文章
使用Web浏览器访问UE应用的最佳实践
在3D/XR应用开发中,尤其是基于UE(虚幻引擎)开发的高精度场景,传统终端因硬件局限难以流畅运行高帧率、复杂效果的三维应用。实时云渲染技术,将渲染任务转移至云端服务器,降低终端硬件要求,确保用户获得流畅体验。具备弹性扩展、优化传输协议、跨平台支持和安全性等优势,适用于多种终端和场景,特别集成像素流送技术,帮助UE开发者实现低代码上云操作,简化部署流程,保留UE引擎的强大开发能力,确保画面精美且终端轻量化。
使用Web浏览器访问UE应用的最佳实践
Gemini Coder:基于 Google Gemini API 的开源 Web 应用生成工具,支持实时编辑和预览
Gemini Coder 是一款基于 Google Gemini API 的 AI 应用生成工具,支持通过文本描述快速生成代码,并提供实时代码编辑和预览功能,简化开发流程。
143 38
Gemini Coder:基于 Google Gemini API 的开源 Web 应用生成工具,支持实时编辑和预览
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
97 10
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
Web端IM聊天消息该不该用浏览器本地存储?一文即懂!
鉴于目前浏览器技术的进步(主要是HTML5的普及),在Web网页端IM聊天应用的技术选型阶段,很多开发者都会纠结到底该不该像原生移动端IM那样将聊天记录缓存在浏览器的本地,还是像传统Web端即时通讯那样继续存储在服务端?本文将为你简洁明了地讲清楚浏览器本地存储技术(Web Storage),然后你就知道到底该怎么选择了。
60 1
Inpaint-Web:纯浏览器端实现的开源图像处理工具
在刷短视频时,常看到情侣在景区拍照被路人“抢镜”,男朋友用手机将路人“P”掉,既贴心又有趣。最近我发现了一个纯前端实现的开源项目——inpaint-web,可在浏览器端删除照片中的部分内容,非常酷。该项目基于 WebGPU 和 WASM 技术,支持图像修复与放大,已在 GitHub 上获得 5.1k Star。项目地址:[GitHub](https://github.com/lxfater/inpaint-web)。
98 3
 Inpaint-Web:纯浏览器端实现的开源图像处理工具
Python Web开发者必看!AJAX、Fetch API实战技巧,让前后端交互如丝般顺滑!
在Web开发中,前后端的高效交互是提升用户体验的关键。本文通过一个基于Flask框架的博客系统实战案例,详细介绍了如何使用AJAX和Fetch API实现不刷新页面查看评论的功能。从后端路由设置到前端请求处理,全面展示了这两种技术的应用技巧,帮助Python Web开发者提升项目质量和开发效率。
87 1
Playwright 是一个强大的工具,用于在各种浏览器上测试应用,并模拟真实设备如手机和平板。通过配置 `playwright.devices`,可以轻松模拟不同设备的用户代理、屏幕尺寸、视口等特性。此外,Playwright 还支持模拟地理位置、区域设置、时区、权限(如通知)和配色方案,使测试更加全面和真实。例如,可以在配置文件中设置全局的区域设置和时区,然后在特定测试中进行覆盖。同时,还可以动态更改地理位置和媒体类型,以适应不同的测试需求。
Playwright 是一个强大的工具,用于在各种浏览器上测试应用,并模拟真实设备如手机和平板。通过配置 `playwright.devices`,可以轻松模拟不同设备的用户代理、屏幕尺寸、视口等特性。此外,Playwright 还支持模拟地理位置、区域设置、时区、权限(如通知)和配色方案,使测试更加全面和真实。例如,可以在配置文件中设置全局的区域设置和时区,然后在特定测试中进行覆盖。同时,还可以动态更改地理位置和媒体类型,以适应不同的测试需求。
240 1
如何使用Python和Flask构建一个简单的RESTful API。Flask是一个轻量级的Web框架
本文介绍了如何使用Python和Flask构建一个简单的RESTful API。Flask是一个轻量级的Web框架,适合小型项目和微服务。文章从环境准备、创建基本Flask应用、定义资源和路由、请求和响应处理、错误处理等方面进行了详细说明,并提供了示例代码。通过这些步骤,读者可以快速上手构建自己的RESTful API。
253 2
Web、RESTful API 在微服务中有哪些作用?
在微服务架构中,Web 和 RESTful API 扮演着至关重要的角色。它们帮助实现服务之间的通信、数据交换和系统的可扩展性。
86 2
前端开发实战:利用Web Speech API之speechSynthesis实现文字转语音功能
前端开发实战:利用Web Speech API之speechSynthesis实现文字转语音功能
553 0

热门文章

最新文章

  • 1
    Burp Suite Professional 2025.2 (macOS, Linux, Windows) - Web 应用安全、测试和扫描
    25
  • 2
    AppSpider Pro 7.5.015 for Windows - Web 应用程序安全测试
    19
  • 3
    【02】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-2月12日优雅草简化Centos stream8安装zabbix7教程-本搭建教程非docker搭建教程-优雅草solution
    54
  • 4
    部署使用 CHAT-NEXT-WEB 基于 Deepseek
    333
  • 5
    【2025优雅草开源计划进行中01】-针对web前端开发初学者使用-优雅草科技官网-纯静态页面html+css+JavaScript可直接下载使用-开源-首页为优雅草吴银满工程师原创-优雅草卓伊凡发布
    26
  • 6
    java spring 项目若依框架启动失败,启动不了服务提示端口8080占用escription: Web server failed to start. Port 8080 was already in use. Action: Identify and stop the process that’s listening on port 8080 or configure this application to listen on another port-优雅草卓伊凡解决方案
    40
  • 7
    零基础构建开源项目OpenIM桌面应用和pc web- Electron篇
    28
  • 8
    【01】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-硬件设备实时监控系统运营版发布-本产品基于企业级开源项目Zabbix深度二开-分步骤实现预计10篇合集-自营版
    20
  • 9
    FastAPI与Selenium:打造高效的Web数据抓取服务 —— 采集Pixabay中的图片及相关信息
    53
  • 10
    springSecurity学习之springSecurity过滤web请求
    60
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等