热门
我希望对我们生成的摘要能够受到控制,例如强调一些内容,而忽略另一些。我们有什么方法解决吗?
基于某种条件引导的视频摘要是一种十分实用的技术,一般可以输入语音或者文字等信息来引导生成的摘要结果,来满足不同用户对视频摘要的不同偏好。以美食探店的视频为示例,用户甲的关注信息可以为菜品种类的介绍,例如该店的招牌菜是炙子烤肉,如何选肉、如何腌制肉是用户甲关注的重点;而用户乙的关注信息可以为店铺的地址、环境等。后续会有自然语言引导的视频摘要模型上线。
包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域