视频 AI 与智能生产(一)|学习笔记

简介: 快速学习视频 AI 与智能生产(一)

开发者学堂课程【视频云技术入门-1024程序员节创造营公益课视频 AI 与智能生产(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/902/detail/14334


视频 AI 与智能生产(一)


目录:

一、 AI 激活数值媒体的沉默资产

二、 高频率智能审核解决方案

三、视频理解算法架构的发展趋势

四、视频字幕Video OCR

、多模态搜索-视频内容搜索

、视频生产赛事分析

七、如何提升生产力

八、核心能力-媒资管理

九、核心能力-智能处理

十、核心能力-模板工厂

十一、行业案例—数字教育

 

一、 AI 激活数值媒体的沉默资产

●视频结构化-“丰富准确的视频详情页"

●多模态搜索“细粒度的视频内容搜索*

●视频辅助生产-“场景化娱乐化的 AGC 视频生产”

 

二、 高频率智能审核解决方案

image.png

场景概述

●审核场景:

对直播画面的涉黄、暴恐涉政、广告、不良场景四大维度进行审核。

●高频截帧:

对于内容风险高的业务如核心主播或交友等类型,采用高频截帧方案,截帧频率为秒~2秒,大幅度规避危险内容曝光的可能性。

关键帧截帧:

对于业务风险相对不高的业务如游戏直播或赛事直播,采用关键帧截帧方案,截帧频率为3秒,可做到优化成本

image.png 

 

三、 视频理解算法架构的发展趋势

image.png 阶段一:图像算法结果后融合

MAP 40%+

阶段二:视频实体及镜头级别的理解

MAP 60%+

阶段三:实体时空关系推理的视频理解

1.如何解决算法性能进一步提高 MAP 80%+

2.如何用好模态实体、时空关系

3.如何面对精细化、定制化的频繁训练问题

 

四、视频字幕—Video OCR

1.语音与图像融合与改写

2.知识纠错与关键词注册

3.视频粒度的 ocr

 

 

五、多模态搜索-视频内容搜索

image.png

通过多模态内容技术,支持以文字搜视频、以图搜视频、以视频搜视频、以图搜图、以人名搜视频等多模检索功能,实现快速准确的内容检索定位。

应用场景:视频版权保护、媒资库内容制作场景媒资检索、短视频消费场景内容搜索

 

相关文章
|
21小时前
|
机器学习/深度学习 人工智能 自然语言处理
【热门话题】如何通过AI技术提升内容生产的效率与质量
本文探讨AI技术如何提升内容生产的效率与质量。通过自然语言处理(NLP)实现智能摘要、自动写作和语言风格优化;计算机视觉用于图像识别和智能设计,提升视频与图像内容生产;数据分析与预测帮助精准洞察受众需求和预测内容趋势;AI推荐系统实现个性化信息流,优化用户体验。尽管AI带来变革,但需结合人类创意与伦理监督,以促进内容产业健康发展。
12 3
|
1天前
|
人工智能 自然语言处理 算法
探讨如何通过AI技术提升内容生产的效率和质量
AI技术在内容生产中扮演重要角色,包括自动生成文章、自动审核内容、个性化推荐、数据分析以及翻译和语音识别,显著提升效率和质量。然而,使用AI时需注意信息安全、隐私和算法偏见问题,应合理结合人工与AI以实现最佳效果。
|
3天前
|
机器学习/深度学习 敏捷开发 人工智能
吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记
吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记
20 0
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
AI生产范式
【5月更文挑战第7天】AI生产范式
18 4
|
9天前
|
机器学习/深度学习 人工智能
超越Sora极限,120秒超长AI视频模型诞生!
【5月更文挑战第1天】 StreamingT2V技术突破AI视频生成界限,实现120秒超长连贯视频,超越Sora等传统模型。采用自回归方法,结合短期记忆的条件注意模块和长期记忆的外观保持模块,保证内容连贯性和动态性。在实际应用中,展示出优秀的动态性、连贯性和图像质量,但仍有优化空间,如处理复杂场景变化和连续性问题。[链接](https://arxiv.org/abs/2403.14773)
29 3
|
12天前
|
人工智能 安全 Linux
《龙蜥理事说》第二期对话统信软件 AI 让操作系统更智能
统信软件携手龙蜥生态提供更好操作系统服务。
|
13天前
|
人工智能 数据安全/隐私保护
Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会
【4月更文挑战第27天】OpenAI公司的新型AI工具Sora能根据文字提示生成超逼真视频,引发关注。尽管已有类似产品,如Runway的Gen-2和谷歌的Lumiere,Sora以其高质量生成效果领先。该技术的进步可能导致2024年全球政治格局的颠覆,同时带来虚假信息的挑战。OpenAI已组建“红队”评估风险,但虚假视频识别仍是难题。尽管有水印解决方案,其有效性尚不确定。Sora在教育、医疗和科研等领域有潜力,但也对创意产业构成威胁。
27 2
|
15天前
|
人工智能 文字识别 自然语言处理
低代码引领AI创新:业务解决方案智能化设计
低代码平台结合AI技术,正推动构建智能化应用的革命。低代码通过可视化界面和预置模块简化开发,提高效率,降低技术门槛,并能灵活应对变化。AI则为应用带来智能决策支持、自动化工作流和增强用户体验。实际应用中,AI用于智能预测、情感分析、OCR和关键字提取,帮助企业加速数字化转型,提升业务价值。
25 1
|
15天前
|
人工智能 搜索推荐 大数据
【视频】如何用人工智能AI、大数据打动消费者洞察PPT|报告分享
【视频】如何用人工智能AI、大数据打动消费者洞察PPT|报告分享
|
17天前
|
人工智能 监控 数据处理
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】1. 快速上手数据集与测试评估过程
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】1. 快速上手数据集与测试评估过程
38 0