RTMP/RTSP推送端和RTMP/RTSP播放端录像设计探讨

简介: 好多开发者认为,无论是RTSP/RTMP推送端还是RTSP/RTMP播放端,涉及到录像,只要2个接口足矣:开始录像、停止录像。

好多开发者认为,无论是RTSP/RTMP推送端还是RTSP/RTMP播放端,涉及到录像,只要2个接口足矣:开始录像、停止录像。


实际场景下,一个好的录像模块,2个接口远远不够, 本文以大牛直播SDK(Github)RTSP/RTMP推送和RTSP/RTMP播放端扩展录像模块为例,介绍下一个好的录像模块,需要具备哪些基本功能属性。


Android、iOS平台不再赘述,本文以Windows平台C#接口为例,先说推送端:

1. 设置录像目录

录像目录不必多解释,为了便于录像文件管理,设置指定的录像目录是基础操作。

 /*
  * 设置本地录像目录, 必须是英文目录,否则会失
  */
  [DllImport(@"SmartPublisherSDK.dll")]
  public static extern UInt32 NT_PB_SetRecorderDirectory(IntPtr handle, [MarshalAs(UnmanagedType.LPStr)] String dir, IntPtr pReserve);

2. 设置单个录像文件最大大小

之所以设置单个录像文件大小,有两个出发点:第一,控制单个文件大小范围,不至于因单个文件过大,中途异常退出或文件过大导致写入失败;第二,达到设定文件大小size后,自动切割生成下个录像文件,便于文件管理。

        /*
         * 设置单个录像文件最大大小, 当超过这个值的时候,将切割成第二个文件
         * 
         * size: 单位是KB(1024Byte), 当前范围是 [5MB-1G], 超出将被设置到范围内
         */
        [DllImport(@"SmartPublisherSDK.dll")]
        public static extern UInt32 NT_PB_SetRecorderFileMaxSize(IntPtr handle, UInt32 size);

3. 设置录像文件名生成规则

设置文件名生成规则,主要是为了不至于每个文件都需要开发者单独指定名称,开发者只要制定录制规则,比如文件名前缀、是否加日期、是否加时间等属性,自动生成文件名。

        /*
         * 设置录像文件名生成规则
         */
        [DllImport(@"SmartPublisherSDK.dll", EntryPoint = "NT_PB_SetRecorderFileNameRuler", CallingConvention = CallingConvention.StdCall)]
        public static extern UInt32 NT_PB_SetRecorderFileNameRuler(IntPtr handle, ref NT_PB_RecorderFileNameRuler ruler);
    /*如果三项都是0的话,将不能启动录像*/
    [StructLayoutAttribute(LayoutKind.Sequential)]
    public struct NT_PB_RecorderFileNameRuler
    {
        public UInt32 type_;                                          // 这个值目前默认是0,将来扩展用
        [MarshalAs(UnmanagedType.LPStr)]
        public String file_name_prefix_;                              // 设置一个录像文件名前缀, 例如:daniulive
        public Int32 append_date_;                                    // 如果是1的话,将在文件名上加日期, 例如:daniulive-2017-01-17
        public Int32 append_time_;                                    // 如果是1的话,将增加时间,例如:daniulive-2017-01-17-17-10-36
    }

4. 启动录像

不多解释,这个只要涉及录像功能,都需要的。

        /*
         * 启动录像
         */
        [DllImport(@"SmartPublisherSDK.dll")]
        public static extern UInt32 NT_PB_StartRecorder(IntPtr handle, IntPtr pReserve);

5. 暂停/恢复录像

暂停录像,好多开发者不可理解,这里举个简单的李总,比如老师每次上课2小时,中间有2次下课休息时间,下课期间,老师可暂停录像,等开始上课后,恢复录像,这样确保了上课内容录制的连续性和完整性。

    /*
         * 暂停录像
         * 
         * is_pause: 1表示暂停, 0表示恢复录像, 输入其他值将调用失败
         * 
         * 成功返回NT_ERC_OK
         * 返回NT_ERC_PB_NEED_RETRY, 请隔一段时间再尝试调用
     */
        [DllImport(@"SmartPublisherSDK.dll")]
        public static extern UInt32 NT_PB_PauseRecorder(IntPtr hanlde, Int32 is_pause);

6. 停止录像

不多解释,这个只要涉及录像功能,都需要的。

        /*
         * 停止录像
         */
        [DllImport(@"SmartPublisherSDK.dll")]
        public static extern UInt32 NT_PB_StopRecorder(IntPtr handle);

7. 录像事件回调

录像事件回调,是好多开发者在设计录像功能模块时容易忽略的,回调的目的是给上层一个反馈,比如开始录像、停止录像状态反馈,亦或单个录像完成后的事件回调。

          NT_PB_E_EVENT_ID_RECORDER_START_NEW_FILE    = NT_PB_E_EVENT_ID_BASE | 0x7,  /*录像写入新文件, param5表示录像文件名*/
          NT_PB_E_EVENT_ID_ONE_RECORDER_FILE_FINISHED = NT_PB_E_EVENT_ID_BASE | 0x8,  /*一个录像文件完成, param5表示录像文件名*/
                case (uint)NTSmartPublisherDefine.NT_PB_E_EVENT_ID.NT_PB_E_EVENT_ID_RECORDER_START_NEW_FILE:
                    event_log = " start new recorder file";
                    if (!String.IsNullOrEmpty(param5))
                    {
                        label_event_status.Text = event_log + " file name:" + param5;
                    }
                    break;
                case (uint)NTSmartPublisherDefine.NT_PB_E_EVENT_ID.NT_PB_E_EVENT_ID_ONE_RECORDER_FILE_FINISHED:
                    event_log = " finish recorder file";
                    if (!String.IsNullOrEmpty(param5))
                    {
                        label_event_status.Text = event_log + " file name:" + param5;
                    }
                    break;

播放端除了上述设置录像目录、指定录像文件名规则,开始录像/停止录像和event回调外,还加入了以下接口:

8. 只录制音频或视频

这个很好理解,比如音视频都有的场景,好多开发者可能实际只需要用到音频或视频,这个时候,就凸显出接口意义了。

        /*
     * 设置是否录视频,默认的话,如果视频源有视频就录,没有就没得录, 但有些场景下可能不想录制视频,只想录音频,所以增加个开关
         * 
     * is_record_video: 1 表示录制视频, 0 表示不录制视频, 默认是1
     */
        [DllImport(@"SmartPlayerSDK.dll")]
        public static extern UInt32 NT_SP_SetRecorderVideo(IntPtr handle, Int32 is_record_video);
    /*
     * 设置是否录音频,默认的话,如果视频源有音频就录,没有就没得录, 但有些场景下可能不想录制音频,只想录视频,所以增加个开关
     *
         * is_record_audio: 1 表示录制音频, 0 表示不录制音频, 默认是1
     */
        [DllImport(@"SmartPlayerSDK.dll")]
        public static extern UInt32 NT_SP_SetRecorderAudio(IntPtr handle, Int32 is_record_audio);

9. 设置录像时音频转AAC编码的开关

设置录像时音频转AAC编码的开关的意义在于,比如有些rtsp流,audio是PCMA或PCMU的,有些rtmp流,audio是SPEEX的,实际使用场景下,aac比较通用,sdk增加其他音频编码(比如speex, pcmu, pcma等)转aac的功能,确保存储下来的MP4文件通用性更好。

总结

一个好多录像模块设计,应该是可作为单独功能模块使用(如同时多路录像存档),亦可和其他模块组合调用,此外,需要和RTMP/RTSP推送、RTMP/RTSP播放、RTSP转发、内置轻量级RTSP服务功能完全分离,支持随时录像,支持设置单个录像文件大小、录像路径等,并支持纯音频、纯视频、音视频录制模式,支持音频(PCMU/PCMA,Speex等)转AAC后再录像,支持RTSP/RTMP H.265(hevc),支持采集端(推送端)录像过程中,暂停录像、恢复录像,从开始录像,到录像结束均有event callback上来等。


这么看下来,录像模块2个接口确实远远不够。

相关文章
|
编解码 开发工具 Android开发
Android平台RTSP轻量级服务|RTMP推送摄像头或屏幕之音频接口设计
好多开发者在做Android平台录像或者RTSP轻量级服务、RTMP推送相关模块时,对需要设计哪些常用接口会心存疑惑,本文主要以大牛直播SDK(官方)为例,简单介绍下Android平台直播推送SDK所有音频相关的接口,感兴趣的开发者可以看看。
254 0
|
缓存 网络协议 开发工具
庖丁解牛之-Android平台RTSP|RTMP播放器设计
我们在做Android平台RTSP或者RTMP播放器开发的时候,需要注意的点非常多,以下,以大牛直播SDK(官方)的接口为例,大概介绍下相关接口设计:
327 0
|
开发者 Windows
.NET 开源扁平化、美观的 C/S 控件库
【10月更文挑战第23天】介绍了三款适用于 .NET 平台的开源扁平化、美观的 C/S 控件库:MaterialSkin 采用 Google Material Design 风格,适合现代感界面;Krypton Toolkit 提供丰富控件,界面易于定制;Fluent Ribbon Control Suite 模仿 Office 界面,适合复杂功能应用。每款控件库均附有示例代码及 GitHub 链接。
750 0
单字节,双字节,四字节能够表示的数值大小范围分别是多少
单字节,双字节,四字节能够表示的数值大小范围分别是多少
|
关系型数据库 测试技术 Serverless
5分钟免费体验PolarDB PG版Serverless的极致弹性!
基于阿里云瑶池数据库解决方案体验馆,带你体验PolarDB PG版 Serverless形态下的性能压测环境,基于可选择的标准压测工具进行压测,构造弹性场景进行压测,实时动态展示弹性能力、价格和性价比结果,压测环境可开放定制修改、可重复验证。参与活动即有机会获得小爱随身音响、体脂秤、极客时间VIP月卡、鼠标垫等精美礼品。
|
编解码 开发工具 C#
RTSP/RTMP播放端录像不可忽视的几个设计要点
很多开发者提到,拉取的摄像机(一般RTSP流)或RTMP流,如果需要录制,需要考虑哪些因素,本文以大牛直播SDK的Windows平台拉流端录像为例(github),做个简单的介绍:
308 0
|
C# C++
基于GDAL的遥感影像显示(C#版)
               说明:本文章转载自:http://blog.csdn.net/rsyaoxin/article/details/9220735         接触GDAL有四五年多时间了,平时都是在C++下使用,最近需要在C#下调用GDAL,所以就开始学习了下,相比C++调用,C#下使用GDAL做图像处理的效率有点低,但是其简单易学,适合菜鸟上手,现把自己刚学到的心得跟大伙分享下,以遥感影像的显示为例。
3140 1
|
1天前
|
人工智能 自然语言处理 JavaScript
2026年Windows+Ollama本地部署OpenClaw保姆级教程:本地AI Agent+阿里云上快速搭建
2026年OpenClaw凭借本地部署、私有化运行的特性,成为打造个人智能体的核心工具,而Ollama作为轻量级本地大模型管理工具,能让OpenClaw摆脱对云端大模型的依赖,实现**本地推理、数据不泄露、全流程私有化**的智能体验。本文基于Windows 11系统,从硬件环境准备、Ollama安装与模型定制、OpenClaw部署配置、技能扩展到常见问题排查,打造保姆级本地部署教程,同时补充阿里云OpenClaw(Clawdbot)快速部署步骤,兼顾本地私有化需求与云端7×24小时运行需求,文中所有代码命令均可直接复制执行,确保零基础用户也能快速搭建属于自己的本地智能体。
2747 11
|
12天前
|
人工智能 自然语言处理 监控
OpenClaw skills重构量化交易逻辑:部署+AI全自动炒股指南(2026终极版)
2026年,AI Agent领域最震撼的突破来自OpenClaw(原Clawdbot)——这个能自主规划、执行任务的智能体,用50美元启动资金创造了48小时滚雪球至2980美元的奇迹,收益率高达5860%。其核心逻辑堪称教科书级:每10分钟扫描Polymarket近千个预测市场,借助Claude API深度推理,交叉验证NOAA天气数据、体育伤病报告、加密货币链上情绪等多维度信息,捕捉8%以上的定价偏差,再通过凯利准则将单仓位严格控制在总资金6%以内,实现低风险高频套利。
6361 57