视觉智能开放平台的搜索结果_热门_第14页-阿里云开发者社区

AV1是一种高效免费的视频编码标准，由AOM联盟制定，相比H.265压缩率提升约27%。各大流媒体平台倾向使用AV1。本文介绍了如何在Linux环境下为FFmpeg集成AV1编解码库libaom、libdav1d和libsvtav1。涉及下载源码、配置、编译和安装步骤，包括设置环境变量以启用这三个库。

# 视觉智能开放平台 # Linux # 编解码 # Python # 开发者

蚝油菜花

博文

来自： ModelScope模型即服务

Sa2VA：别再用PS抠图了！字节跳动开源Sa2VA：一句话自动分割视频，连头发丝都精准

Sa2VA 是由字节跳动等机构联合推出的多模态大语言模型，结合 SAM2 和 LLaVA 实现对图像和视频的精确分割和对话功能。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具 # 计算机视觉

蚝油菜花

博文

来自： ModelScope模型即服务

Light-A-Video：好莱坞级打光自由！上海AI Lab开源视频打光AI，无需训练秒改画面氛围，3步让阴天变夕阳

Light-A-Video 是由上海AI Lab联合交大等高校推出的无需训练的视频重照明方法，支持高质量、时间一致的光照控制，零样本生成和前景背景分离处理。

# 视觉智能开放平台 # 人工智能 # Python

孑小白

4月前

博文

来自：视觉智能

AutoGod:安卓5-16全兼容！一站式自动化框架，开发效率直接拉满

Auto-God是一站式安卓自动化框架，兼容Android 5–16，覆盖手势、视觉（OCR/YOLO）、网络、UI（Material3悬浮界面）、拓展及安全（防HOOK/抓包/破解）全能力，开箱即用，真机/模拟器/云手机全支持，让自动化开发更简单、高效、安全。

# 视觉智能开放平台 # 编解码 # 文字识别 # 安全 # Android开发 # 数据安全/隐私保护

真的很搞笑

问答

来自：视觉智能

视觉智能平台人脸融合这个功能我们集成进App了，今天更新被拒了，说要进行算法备案，想麻烦问下有没有？

# 视觉智能开放平台 # 算法

真的很搞笑

问答

来自：视觉智能

文字识别OCR API有没有Delphi的demo哦？

# 文字识别 # 视觉智能开放平台 # 文字识别 # API

青城山下庄文杰

问答

来自： ModelScope模型即服务

ModelScope创空间的gradio如何通过api调用？

# 视觉智能开放平台 # API

...

免费试用

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台