一文读懂Web Codecs API:浏览器背后的媒体魔术师

简介: 一文读懂Web Codecs API:浏览器背后的媒体魔术师

引言

在早期的Web 网页中,视频播放通常要依靠 FlashSilverlight 等插件来完成,浏览器是不支持直接播放视频的。

随着网络技术的发展,视频这种媒体方式的需求变得普遍,HTML5中,出现了一个新的元素Video,使得我们可以不借助插件播放视频。

当然,它并不支持所有的格式,而且不同的浏览器厂商支持的格式也有所不同,为什么会出现只支持部分格式? 在 Web 中,能实现无插件播放的有3GP、 ADTS、Flac、Mpeg-4、Ogg、Mov、WebM等,为什么能播放这些呢?

其实就是浏览器内置了相关的解码器,使得我们可以对其解码播放,反之,没有对应解码器,就无法进行播放。

视频播放的步骤

大致如下:

image.png

当然,我们今天的主角并不是 Video 元素,我们的主角是 Web Codecs Api

什么是 Web Codecs ,顾名思义,就是 Web 中的编码解码器。

对谁编码和解码?对视频和音频

旗下主要有 AudioDecodeVideoDecoderAudioEncoderVideoEncoder 这四大将。

能干啥?能获得到对视频流的单个帧和音频数据块的底层访问能力,实现完全控制媒体。 例子:使用 Web CodecsMP4(H264) 获取数据、解封装播放。

我们所见到的视频文件,里面往往包含视频和音频,视频其实是像幻灯片一样,由一张一张的图像组成。

而视频文件,就是一堆图像数据和音频组合起来的,通过特定的编码压缩,通过特定的协议存储。

反过来可以通过解协议、解封装、解码来进行播放。

第一步:解协议解封装。

image.png

一个MP4视频文件大致由以上部分组成。这里我们使用的是 MP4Box.js 进行解封装。

解封装获取文件的信息后,我们就需要配置解码器,需要用到的解码器有视频解码器和音频解码器,对解码后的数据进行处理就能用于播放。

基本的流程如下:

image.png

代码实现

使用类封装

// 使用MP4 Box 解封装
import Mp4box from 'mp4box'
 
// 非worker模式
 
export default class VideoPlayer {
 // options 暂时只有一个renderCanvas
 constructor(options) {
   // 解码器
   this.$codecs = new Codecs(this.output.bind(this))
   // 渲染器
   this.$render = new Render(options.renderCanvas)
 }
 // 输出
 output(type, data) {
   // 输出
   if(type === 'frame') {
     this.$render.render(data)
   } else {
     this.$render.playAudio(data)
   }
   // 销毁帧
   data.close()
 }
 // 加载文件
 loadFile(file) {
   return new Promise((resolve, reject) => {
     file.arrayBuffer().then((buffer) => {
       buffer.fileStart = 0
       this.$codecs.codecFile(buffer)
       resolve(true)
     }).catch((e) => {
       reject(e)
     })
   })
 }
}

渲染类封装

// 渲染类
class Render {
 constructor(canvas) {
   this.canvas = canvas
   this.ctx = canvas.getContext('2d')
   this.audioCtx = new AudioContext()
   this.audioOutput = this.audioCtx.destination
 
   this.interleavingBuffers = []
   this.trackGenerator = new MediaStreamTrackGenerator({ kind: "audio" });
   this.writer = this.trackGenerator.writable.getWriter()
 
   const audio = document.createElement('audio')
   audio.setAttribute('controls', 'controls')
   document.body.appendChild(audio)
   const mediaStream = new MediaStream([this.trackGenerator]);
   audio.srcObject = mediaStream;
   
 }
 render(frame) {
   const { canvas, ctx } = this
   canvas.width = frame.displayWidth
   canvas.height = frame.displayHeight
   ctx.fillStyle = '#f00'
   ctx.clearRect(0, 0, frame.displayWidth, frame.displayHeight)
   ctx.drawImage(frame, 0, 0, frame.displayWidth, frame.displayHeight)
 }
 playAudio(audioData) {
   this.bufferAudioData(audioData)
 }
 bufferAudioData(audioData) {
   const data = structuredClone(audioData)
   this.writer.write(audioData)
 }
}

解码类封装

class Codecs {
  // 初始化MP4
  public $M: any = Mp4box.createFile();
  constructor(output = (type, frame) => {}) {
    // 初始化
    this.$M.onReady = this.onReady.bind(this);
    this.$M.onSamples = this.onSamples.bind(this);
    // 视频解码器
    this.$videoCodec = new VideoDecoder({
      output(frame: any) {
        output('frame', frame);
      },
      error(e: any) {
        console.error(e);
      },
    });
    // 音频解码器
    this.$audioCodec = new AudioDecoder({
      output: (audioData: any) => {
        output('audioData', audioData);
      },
      error: (e: any) => {
        console.error(e);
      },
    });
  }
  // 当准备好了之后
  onReady(info: any) {
    const videoTrack = info.videoTracks[0];
    const videoConfig = {
      codec: videoTrack.codec,
      codedHeight: videoTrack.video.height,
      codedWidth: videoTrack.video.width,
      description: this.description(videoTrack),
    };
    const audioTrack = info.audioTracks[0];
    const audioConfig = {
      codec: audioTrack.codec,
      sampleRate: 48000,
      numberOfChannels: 2,
      description: this.description(audioTrack),
    };
    // 是否支持编码标准
    VideoDecoder.isConfigSupported(videoConfig).then((res) => {
      this.$videoCodec.configure(videoConfig);
      this.$M.setExtractionOptions(videoTrack.id);
      AudioDecoder.isConfigSupported(audioConfig).then((res) => {
        this.$audioCodec.configure(audioConfig);
        this.$M.setExtractionOptions(audioTrack.id);
        this.$M.start();
      });
    });
  }
  // 获取解码器的描述,才能完整解码
  description(track) {
    const trak = this.$M.getTrackById(track.id);
    console.log('trak', trak);
    for (const entry of trak.mdia.minf.stbl.stsd.entries) {
      if (entry.avcC || entry.hvcC) {
        const stream = new Mp4box.DataStream(
          undefined,
          0,
          Mp4box.DataStream.BIG_ENDIAN
        );
        if (entry.avcC) {
          entry.avcC.write(stream);
        } else {
          entry.hvcC.write(stream);
        }
        return new Uint8Array(stream.buffer, 8); // Remove the box header.
      }
      if (entry.esds) {
        return entry.esds.esd.descs[0].descs[0].data;
      }
    }
    throw 'avcC or hvcC not found';
  }
  // MP4Box 传出的样本
  onSamples(track_id: any, ref: any, samples: any) {
    if (track_id === 2) {
      this.decodeAudio(samples);
    } else {
      this.decodeVideo(samples);
    }
  }
  // 解码视频
  decodeVideo(samples) {
    for (const sample of samples) {
      const data = new EncodedVideoChunk({
        type: sample.is_sync ? 'key' : 'delta',
        timestamp: (1e6 * sample.cts) / sample.timescale,
        duration: (1e6 * sample.duration) / sample.timescale,
        data: sample.data,
      });
      this.$videoCodec.decode(data);
    }
  }
  // 解码音频
  decodeAudio(samples) {
    for (const sample of samples) {
      const data = new EncodedAudioChunk({
        type: sample.is_sync ? 'key' : 'delta',
        timestamp: (1e6 * sample.cts) / sample.timescale,
        duration: (1e6 * sample.duration) / sample.timescale,
        data: sample.data,
      });
      this.$audioCodec.decode(data);
    }
  }
  // 开始解码
  codecFile(file: File | ArrayBuffer) {
    if (file instanceof File) {
      file.arrayBuffer().then((buffer) => {
        this.$M.appendBuffer(buffer);
        this.$M.flush();
      });
    } else if (file instanceof ArrayBuffer) {
      this.$M.appendBuffer(file);
      this.$M.flush();
    }
  }
}

以上就是 Web Codes Api 的一个小案例,实现了基本的解码播放。



相关文章
|
1月前
|
Java API 数据库
构建RESTful API已经成为现代Web开发的标准做法之一。Spring Boot框架因其简洁的配置、快速的启动特性及丰富的功能集而备受开发者青睐。
【10月更文挑战第11天】本文介绍如何使用Spring Boot构建在线图书管理系统的RESTful API。通过创建Spring Boot项目,定义`Book`实体类、`BookRepository`接口和`BookService`服务类,最后实现`BookController`控制器来处理HTTP请求,展示了从基础环境搭建到API测试的完整过程。
42 4
|
1月前
|
XML JSON API
ServiceStack:不仅仅是一个高性能Web API和微服务框架,更是一站式解决方案——深入解析其多协议支持及简便开发流程,带您体验前所未有的.NET开发效率革命
【10月更文挑战第9天】ServiceStack 是一个高性能的 Web API 和微服务框架,支持 JSON、XML、CSV 等多种数据格式。它简化了 .NET 应用的开发流程,提供了直观的 RESTful 服务构建方式。ServiceStack 支持高并发请求和复杂业务逻辑,安装简单,通过 NuGet 包管理器即可快速集成。示例代码展示了如何创建一个返回当前日期的简单服务,包括定义请求和响应 DTO、实现服务逻辑、配置路由和宿主。ServiceStack 还支持 WebSocket、SignalR 等实时通信协议,具备自动验证、自动过滤器等丰富功能,适合快速搭建高性能、可扩展的服务端应用。
100 3
|
3天前
|
人工智能 前端开发 计算机视觉
Inpaint-Web:纯浏览器端实现的开源图像处理工具
在刷短视频时,常看到情侣在景区拍照被路人“抢镜”,男朋友用手机将路人“P”掉,既贴心又有趣。最近我发现了一个纯前端实现的开源项目——inpaint-web,可在浏览器端删除照片中的部分内容,非常酷。该项目基于 WebGPU 和 WASM 技术,支持图像修复与放大,已在 GitHub 上获得 5.1k Star。项目地址:[GitHub](https://github.com/lxfater/inpaint-web)。
40 3
 Inpaint-Web:纯浏览器端实现的开源图像处理工具
|
11天前
|
前端开发 API 开发者
Python Web开发者必看!AJAX、Fetch API实战技巧,让前后端交互如丝般顺滑!
在Web开发中,前后端的高效交互是提升用户体验的关键。本文通过一个基于Flask框架的博客系统实战案例,详细介绍了如何使用AJAX和Fetch API实现不刷新页面查看评论的功能。从后端路由设置到前端请求处理,全面展示了这两种技术的应用技巧,帮助Python Web开发者提升项目质量和开发效率。
25 1
|
15天前
|
Web App开发 定位技术 iOS开发
Playwright 是一个强大的工具,用于在各种浏览器上测试应用,并模拟真实设备如手机和平板。通过配置 `playwright.devices`,可以轻松模拟不同设备的用户代理、屏幕尺寸、视口等特性。此外,Playwright 还支持模拟地理位置、区域设置、时区、权限(如通知)和配色方案,使测试更加全面和真实。例如,可以在配置文件中设置全局的区域设置和时区,然后在特定测试中进行覆盖。同时,还可以动态更改地理位置和媒体类型,以适应不同的测试需求。
Playwright 是一个强大的工具,用于在各种浏览器上测试应用,并模拟真实设备如手机和平板。通过配置 `playwright.devices`,可以轻松模拟不同设备的用户代理、屏幕尺寸、视口等特性。此外,Playwright 还支持模拟地理位置、区域设置、时区、权限(如通知)和配色方案,使测试更加全面和真实。例如,可以在配置文件中设置全局的区域设置和时区,然后在特定测试中进行覆盖。同时,还可以动态更改地理位置和媒体类型,以适应不同的测试需求。
17 1
|
17天前
|
JSON API 数据格式
如何使用Python和Flask构建一个简单的RESTful API。Flask是一个轻量级的Web框架
本文介绍了如何使用Python和Flask构建一个简单的RESTful API。Flask是一个轻量级的Web框架,适合小型项目和微服务。文章从环境准备、创建基本Flask应用、定义资源和路由、请求和响应处理、错误处理等方面进行了详细说明,并提供了示例代码。通过这些步骤,读者可以快速上手构建自己的RESTful API。
25 2
|
27天前
|
监控 负载均衡 API
Web、RESTful API 在微服务中有哪些作用?
在微服务架构中,Web 和 RESTful API 扮演着至关重要的角色。它们帮助实现服务之间的通信、数据交换和系统的可扩展性。
47 2
|
1月前
|
人工智能 搜索推荐 API
用于企业AI搜索的Bocha Web Search API,给LLM提供联网搜索能力和长文本上下文
博查Web Search API是由博查提供的企业级互联网网页搜索API接口,允许开发者通过编程访问博查搜索引擎的搜索结果和相关信息,实现在应用程序或网站中集成搜索功能。该API支持近亿级网页内容搜索,适用于各类AI应用、RAG应用和AI Agent智能体的开发,解决数据安全、价格高昂和内容合规等问题。通过注册博查开发者账户、获取API KEY并调用API,开发者可以轻松集成搜索功能。
|
1月前
|
前端开发 JavaScript API
惊呆了!学会AJAX与Fetch API,你的Python Web项目瞬间高大上!
在Web开发领域,AJAX与Fetch API是提升交互体验的关键技术。AJAX(Asynchronous JavaScript and XML)作为异步通信的先驱,通过XMLHttpRequest对象实现了局部页面更新,提升了应用流畅度。Fetch API则以更现代、简洁的方式处理HTTP请求,基于Promises提供了丰富的功能。当与Python Web框架(如Django、Flask)结合时,这两者能显著增强应用的响应速度和用户体验,使项目更加高效、高大上。
50 2
|
1月前
|
前端开发 API 开发者
从零到精通,AJAX与Fetch API让你的Python Web前后端交互无所不能!
从零到精通,AJAX与Fetch API让你的Python Web前后端交互无所不能!
41 3