文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

请问“视频摘要”能力是否可以输入条件来引导摘要结果

我希望对我们生成的摘要能够受到控制，例如强调一些内容，而忽略另一些。我们有什么方法解决吗？

展开

收起

游客5xcaq2cmhsdo2 2022-10-31 10:51:40 879 版权

1 条回答

写回答

取消提交回答

jianguowang

基于某种条件引导的视频摘要是一种十分实用的技术，一般可以输入语音或者文字等信息来引导生成的摘要结果，来满足不同用户对视频摘要的不同偏好。以美食探店的视频为示例，用户甲的关注信息可以为菜品种类的介绍，例如该店的招牌菜是炙子烤肉，如何选肉、如何腌制肉是用户甲关注的重点；而用户乙的关注信息可以为店铺的地址、环境等。后续会有自然语言引导的视频摘要模型上线。

2022-10-31 18:06:36

赞同展开评论

相关问答

计算机视觉

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136846

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11330

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268903

11

0

#支付宝授权提示请在支付宝客户端打开链接

18987

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87578

49

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35850

17

0

this xml file does not appear to have any style in

55176

11

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

3383

18

0

轻量级应用服务器端口问题（打不开）

32497

21

0

LoRa的网络覆盖能力范围是怎么样的？

4340

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

基于黏菌算法/粒子群算法优化BiLSTM的空气质量指数AQI序列预测（SMA/PSO-BiLSTM）附Matlab代码

【无人机路径规划】复杂三维山地环境下蚁群优化算法ACO求解多无人机动态避障路径规划研究附MATLAB代码

直升机停机坪目标检测数据集（9000 张图片已划分、已标注）| AI训练适用于目标检测任务

无人机植物病害目标检测数据集（1500 张图片已划分、已标注）| AI训练适用于目标检测任务

三类公路裂缝（网状裂缝、纵向裂缝、横向裂缝）目标检测数据集（ 2000 张图片已划分、已标注）| AI训练适用于目标检测任务

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

请问去哪里找ModelScope里面各个模型的id？

ModelScope下载速度慢怎么解决？

在ModelScope中，下载模型时的ssl问题怎么解决？!

如何下载modelscope模型？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这里的modelID怎么填写？

ModelScope这个免费额度可以在哪里查询啊？

ModelScope模型是咋收费的, 是按机器每小时收费嘛？

展开全部

基于YOLO11的交通违规检测系统（Python源码+数据集+Pyside6界面）

红外小目标检测新突破！异常感知检测头AA-YOLO：节俭又鲁棒，小样本也能精准识别

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

HunyuanVideo：腾讯推出的开源视频生成模型，参数高达130亿

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

展开全部

还有其他疑问?