开源2.0|从事视频剪辑的“熬者们”,自动化剪辑工具 FunClip请收好

简介: 开源2.0|从事视频剪辑的“熬者们”,自动化剪辑工具 FunClip请收好

本文来源:阿里云语音AI


深受以上烦恼缠身的剪辑星人


FunClip绝对是你的好帮手!


由阿里巴巴通义实验室语音团队开源的自动化视频剪辑工具FunClip在近期迎来了重大更新,在打磨语音识别、视频自动化剪辑基础功能之上进一步集成了大语言模型的能力,支持用户在上传视频、进行音轨的语音识别之后,通过我们提供的大语言模型调用接口,根据自己设置的prompt对视频的SRT字幕进行分析与精选,并根据LLM推理结果进行智能剪辑。


👉FunClip基础功能回顾


FunClip项目地址:https://github.com/alibaba-damo-academy/FunClip


FunASR项目地址:https://github.com/alibaba-damo-academy/FunASR


通过Modelscope创空间体验FunClip:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary


FunClip的基础功能


FunClip是一款基于Gradio构建的完全开源、本地部署、精准裁剪的视频剪辑工具。


通过调用阿里巴巴通义实验室开源的FunASR工具包与Paraformer系列模型,FunClip首先对视频的音轨进行精确的语音识别,识别过程支持热词定制化并且能够一体化的预测识别结果的时间戳。


随后,基于识别结果、时间戳与标点模型的切句,FunClip能够自动生成视频的SRT字幕。如果需要区分说话人,那么FunClip也会为字幕中的每一句标注说话人ID信息。随后在裁剪阶段,用户可以选择文本段落中任意的片段,或者选择想要裁剪出的说话人的ID,复制到相应位置,点击裁剪即可获得需要的视频片段。FunClip支持在裁剪阶段自动合成字幕、配置起止位置的时间偏移,配置字幕的颜色与尺寸等。


不久之前,FunClip升级到v1.1版本,主要进行了如下更新:


  • 支持配置输出文件目录,保存ASR中间结果与视频裁剪中间文件;


  • 易用性升级,视频与音频裁剪功能在同一页,按钮位置调整;


  • 修复了由于FunASR接口升级引入的bug,该bug曾导致一些严重的剪辑错误;


  • 支持为每一个段落配置不同的起止时间偏移;

image.png

(FunClip v1.1.0版本界面与使用方法)


‍▎FunClip2.0:大语言模型智能剪辑


在大语言模型日益火爆的今天,我们希望能够借助LLM的理解能力为视频剪辑增加更多的智能元素,让AI更好地为大家所用。FunClip在今天开源了2.0版本,开放了基于大语言模型的智能剪辑功能。


首先,我们集成了包括通义实验室Qwen系列大模型,OpenAI的GPT系列大模型在内的多种大模型调用方式,用户首先需要选择模型并且配置对应的API Key。在进行视频的识别、获取到SRT字幕之后,点击LLM推理按钮,FunClip会自动组合System Prompt,User Prompt与视频SRT字幕,根据对指令的理解截取字幕中的对应片段。例如,我们可以让大模型完成这样的功能:


  1. 裁剪出视频中的精彩片段;


  1. 裁剪出视频中与“美食”相关的片段;


  1. 裁剪出视频中使用了比喻与排比修辞手法的片段;


以上功能只需要在prompt中输入,借助大模型的理解能力,帮助用户提高视频剪辑的效率。更多的prompt的配置与使用方法也欢迎大家在讨论区交流:)


下一步,点击LLM智能裁剪,FunClip会匹配LLM输出结果中的时间戳部分,对原始的视频进行裁剪。这个过程中同样支持为视频自动添加字幕,以及对字幕进行个性化配置。 image.png

FunClip基于LLM智能剪辑的使用方法


相关文章
|
2月前
|
运维 Prometheus 监控
3 年部署经验总结:用自动化工具轻松管理 300+ 服务器开源软件
三年前接手公司IT部门时,我满怀信心,却发现部署效率低下。尽管使用了GitLab、Jenkins、Zabbix等100+开源工具,部署仍耗时费力。文档厚重如百科,却难解实际困境。一次凌晨三点的加班让我下定决心改变现状。偶然看到一篇国外博客,介绍了自动化部署的高效方式,我深受启发。
143 0
|
24天前
|
机器学习/深度学习 人工智能 测试技术
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
215 9
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
|
8天前
|
人工智能 搜索推荐 UED
一个牛逼的国产AI自动化工具,开源了 !
AiPy是国产开源AI工具,结合大语言模型与Python,支持本地部署。用户只需用自然语言描述需求,即可自动生成并执行代码,轻松实现数据分析、清洗、可视化等任务,零基础也能玩转编程,被誉为程序员的智能助手。
|
1月前
|
Java 测试技术 API
自动化测试工具集成及实践
自动化测试用例的覆盖度及关键点最佳实践、自动化测试工具、集成方法、自动化脚本编写等(兼容多语言(Java、Python、Go、C++、C#等)、多框架(Spring、React、Vue等))
77 6
|
16天前
|
人工智能 缓存 自然语言处理
86_自动化提示:AutoPrompt工具
在当今人工智能领域,提示工程(Prompt Engineering)已成为释放大语言模型(LLM)潜能的关键技术。随着LLM规模和能力的不断增长,如何设计高效、精确的提示词成为研究和应用的焦点。然而,传统的手工提示工程面临着巨大挑战
|
2月前
|
人工智能 数据可视化 数据挖掘
团队日报不用愁!自动化生成工具亲测:任务进度实时同步
本文深入分析了传统手动日报在数据孤岛、格式混乱和时效性差三大痛点,并探讨了自动化日报带来的效率提升、决策优化等四大核心价值。通过对板栗看板、SmartBrief、n8n 等六款主流工具的功能、适用场景及实战效果进行测评,为企业提供科学的选型建议与实施路径。
团队日报不用愁!自动化生成工具亲测:任务进度实时同步
|
2月前
|
人工智能 供应链 数据可视化
工作流梳理工具实战教程:手把手教你绘制第一张自动化流程图
本文剖析了团队因流程混乱导致重复劳动和效率低下的问题,提出通过工作流梳理提升协作效率的解决方案。总结了流程梳理的六大核心需求,并深度测评了6款主流工具,国内有板栗看板那,国外有kiss flow结合团队规模与需求提供选型建议,助力企业高效落地流程优化。
|
1月前
|
安全 搜索推荐 机器人
风险规则引擎-RPA 作为自动化依赖业务决策流程的强大工具
机器人流程自动化(RPA)是一种通过软件“机器人”自动执行重复性任务的技术,能大幅提升工作效率。它适用于财务、电商等领域的标准化流程,如账单处理和退货管理。然而,RPA在复杂决策场景中存在局限,需结合决策模型(DMN)和业务规则管理系统(BRMS)实现流程与决策的协同自动化,从而增强灵活性与业务价值。
|
3月前
|
数据采集 人工智能 API
推荐一款Python开源的AI自动化工具:Browser Use
Browser Use 是一款基于 Python 的开源 AI 自动化工具,融合大型语言模型与浏览器自动化技术,支持网页导航、数据抓取、智能决策等操作,适用于测试、爬虫、信息提取等多种场景。
669 4
推荐一款Python开源的AI自动化工具:Browser Use