批量提取某音视频文案(二)

简介: 介绍批量提取视频文案的流程, 以及做视频的步骤

牙叔教程 简单易懂

之前写过一篇  批量提取某音视频文案 ,

在之前的教程中, 我用的是微软的语音转文字功能, 今天我们换个方法,

使用 逗哥配音文案提取 功能

准备工作 下载视频和音频

我在github找到的是这个仓库
https://github.com/Johnserf-Seed/TikTokDownload


注意一定要阅读 readme.md ,

并且  一定运行 ./server.bat 启动本地接口解析,

每次我老是忘记运行 bat, 所以总是报错, 运行以后就不会报错了

这是我批量下载的视频和音频


红色的是视频

蓝色的是音频


音频转文字步骤

把音频上传, 然后点击提取文案即可,

10分钟的音频, 消耗时间 25 秒

文案就提取出来了


提取文案以后, 我们改吧改吧就要把它变成视频,

改文案的两种工具

  • ChatGPT
  • Claude

改文案技巧

把文案喂给 AI , 让 AI 模仿写作专家来写文案, 让 AI 当 古龙, 金庸, 司马迁, 鲁迅,

把指定作家的作品告诉给 AI , 让他拥有这个作者的人格和技能

AI 写出文案以后, 我们自己仍然要修改一遍,

因为他写的人称, 描述, 动作, 可能不一定符合你的想法

文案有了以后, 就要转成音频了

文案转音频

我们使用 逗哥配音 的 角色 云浩宇, 全网最火,

语速就参考一下同行的语速, 一般都比较快, 很有有文案需要较慢的语速

如果不知道声音的参数如何设置, 可以看  逗哥配音   的帮助文档, 里面还有 AU 调试声音的教程


提取字幕

音频有了以后,  逗哥配音  还可以导出字幕


剪映导入字幕

文案转成音频, 并且提取字幕以后, 我们就要出图了

生成图片技巧

图片中肯定会有人物出现, 如何固定人物?

我们要指定人物的样子, 尤其是头发和五官


生成图片, 我们使用的是

ChatGPT联网版, Stable Diffusion画图, 这个星球全都有, 低调使用, 别外传


这是人物咒语

1名男子,21岁,短发,黑发,刘海,黑眼睛,眉毛上翘,白皮肤,无表情,栗色嘴巴

1man, 21 years,short hair, black hair, straight hair, bangs, black eyes, cocked eyebrow, White skin, expressionless, chestnut mouth


让他吃饭

餐厅, 坐着, 吃饭, 红烧肉,

1man, 21 years,short hair, black hair, straight hair, bangs, black eyes, cocked eyebrow, White skin, expressionless, chestnut mouth

Restaurant, sitting, eating, roast pork.


可以看到, 人物相似度是差不多的, 是满足小说推文, 制作视频需求的


图片排序

图片生成完以后, 我们要整理图片, 按顺序编号1,2,3,

这样在导入剪映的时候, 图片就是编排好, 后期就不用一个一个找图片了

就按照文案, 按照字幕, 提前给图片排序

剪映图片默认时长是 5 秒


剪映必须会的快捷键

使用剪映做小说推文必用的快捷键

分割图片   Ctrl + B

上一分割点   ↑

下一分割点   ↓

上一帧   ←

下一帧   →

轨道放大缩小   Ctrl + 滚轮

轨道左右移动   Alt + 滚轮



打关键帧

不懂关键帧的可以看这篇教程

剪映 自动打关键帧 AutoHotkey


关键帧如果打错位置的话, 可以用鼠标拖动关键帧, 直接拖到图片尾部

除了图片要打关键帧, 有时候, 蒙版有时候也要打关键帧, 方法都是一样的.

如果要做 双开门 , 就需要用到 动画  , 向上滑动和向下滑动


动画时长 0.2 秒


为什么是 0.2 秒呢? 我们看看 ChatGPT 如何解释

将图片的闪现时长设置在0.1-0.3秒,可以使观众在短时间内注意到图片内容。这个建议来自于人眼对视觉刺激的反应时间。

当一个视觉刺激呈现在我们面前时,大脑需要一定的时间来处理这个信息。根据研究,人类对视觉刺激的反应时间大约为0.1-0.4秒不等。所以,将图片的闪现时长设定在0.1-0.3秒之间,能够让观众在短时间内注意到图片,同时又让图片保持了突出的效果。

然而,请注意,在显示速度非常快的情况下,过多快速闪现的画面可能会导致观众感到不适。因此,在设计视频时,请确保在更突出的闪现效果与观众舒适度之间找到平衡。


关键帧打完以后, 就要给视频前几十秒加特效了

特效

特效有以下几种

  • 媒体
  • 音频
  • 贴纸
  • 特效
  • 转场
  • 滤镜
  • 模板

男频用音频和特效

女频可能还会用模板


特效加完以后, 就要开始配乐了

配乐

伤感文案不能配搞笑音乐, 大佬用啥你用啥

声音渐入渐出

字幕

大佬用啥你用啥



封面

视频一般都取第一帧做封面, 所以我们要在视频开头留下封面的空间

按三下 →, 这三帧就放封面图片

封面之后才开始放其他图片


图片高清

Stable Diffusion 生成的图片一般是 512X512

我们可以用512做, 然后再把图片变成高清图片

图片高清软件, 可以看这个教程 图片无损放大-AI为图片开光

这个软件还支持批量处理图片, 并且图片处理之后会覆盖源文件, 名字也是一样的,

当然了, 你也可以设置把处理后的图片放到另外的文件夹

我懒得弄高清, 直接用的剪映的 超清画质

这个超清画质和那些批量高清软件一样,

也是一张一张处理图片



该星球提供 ChatGPT 和 Stable Diffusion

支持N多大模型, 就不用你自己一个一个去上传大几G的模型数据了



还支持微调模型, 以及各种VAE

星球提供的ChatGPT可以参考这个教程, 可以直接听歌和看电影

ChatGPT联网版, Stable Diffusion画图, 这个星球全都有, 低调使用, 别外传


微信公众号 牙叔教程


相关文章
|
8月前
|
监控
基于videoPlayer实现视频播放联动文字播报功能
基于videoPlayer实现视频播放联动文字播报功能
108 0
|
11月前
|
消息中间件 文字识别 PHP
批量名片识别解决方案
批量对名片图片进行识别,并保存在数据库中,识别完成后并完成消息通知
243 1
|
1月前
|
开发工具 数据安全/隐私保护 Android开发
视觉智能平台常见问题之图片解析出的水印图判断是自己添加的水印图如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
19 1
|
1月前
|
机器学习/深度学习 算法 开发工具
视觉智能平台常见问题之视频封面输出的图片会出现过曝如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
22 0
|
7月前
|
关系型数据库 分布式数据库 数据库
沉浸式学习PostgreSQL|PolarDB 8: 电商|短视频|新闻|内容推荐业务(根据用户行为推荐相似内容)、监控预测报警系统(基于相似指标预判告警)、音视图文多媒体相似搜索、人脸|指纹识别|比对 - 向量搜索应用
1、在电商业务中, 用户浏览商品的行为会构成一组用户在某个时间段的特征, 这个特征可以用向量来表达(多维浮点数组), 同时商品、店铺也可以用向量来表达它的特征. 那么为了提升用户的浏览体验(快速找到用户想要购买的商品), 可以根据用户向量在商品和店铺向量中进行相似度匹配搜索. 按相似度来推荐商品和店铺给用户. 2、在短视频业务中, 用户浏览视频的行为, 构成了这个用户在某个时间段的兴趣特征, 这个特征可以用向量来表达(多维浮点数组), 同时短视频也可以用向量来表达它的特征. 那么为了提升用户的观感体验(推荐他想看的视频), 可以在短视频向量中进行与用户特征向量的相似度搜索.
228 0
|
7月前
|
人工智能 自然语言处理 监控
录音转写和AI质检的区别和使用场景
录音转写是将语音或录音转化为文本形式的过程。它通常涉及使用自然语言处理技术和语音识别算法来将音频文件中的语音转换为可读的文本格式。 AI质检是一种利用人工智能技术对客户服务、销售和其他电话中心交互进行自动化评估的过程。通过分析和评估客户和代表之间的通话,AI质检可以提供有关客户体验和代表表现的实时洞察和详细报告。 虽然这两种技术都与电话中心相关,但它们的目的和应用场景不同。录音转写主要用于记录和保存通话内容,以便后续参考和分析。而AI质检则旨在自动化监控和提高客户服务和销售的质量,并提供有关员工表现和客户需求的反馈。 有关系统问题欢迎和博主技术交流。
|
9月前
|
存储 编解码 数据可视化
漏刻有时数据可视化语音留言墙开发日志(微信录音&七牛云amr转换成mp3存储转码)
漏刻有时数据可视化语音留言墙开发日志(微信录音&七牛云amr转换成mp3存储转码)
57 0
|
11月前
|
前端开发 API 开发工具
批量提取某音文案
本文介绍了批量提取文案的思路, 以及操作过程中的问题的处理方法, 并给了详细的参考代码, 以及对应的文档.
215 0
|
人工智能 文字识别 API
20行代码教你如何批量提取图片中文字
大家好,我是志斌~ 之前志斌在考研的时候遇到了一个问题,就是要将图片中的文字给提取出来,当时是J哥帮忙搞出来的,现在已经考完研了,也学会了提取方式,现在来给大家分享一下。
686 0
20行代码教你如何批量提取图片中文字
|
JavaScript 算法 前端开发
姜饼短视频无水印分析
姜饼短视频无水印分析
67 0