视觉智能开放平台的搜索结果_热门_第19页-阿里云开发者社区

游客npqcatx4ki5fs

|

问答

|

来自：视觉智能

阿里云金融级实人认证支持uniapp开发微信小程序吗？

# 实人认证 # 视觉智能开放平台 # 小程序

蓝易云

|

博文

|

来自：视觉智能

解决IDEA tomcat控制台只有server日志

请注意，确保在调试或开发阶段使用更详细的日志级别（如 `DEBUG`或 `TRACE`），但在生产环境中应将其设置为更高的级别以减少日志量。

# 日志服务 # 视觉智能开放平台 # Java # 应用服务中间件

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

AVS3是中国首个8K及5G视频编码标准，相比AVS2和HEVC性能提升约30%。解码器libuavs3d支持8K/60P视频实时解码，兼容多种平台。《FFmpeg开发实战》书中介绍了在Windows环境下如何集成libuavs3d到FFmpeg。集成步骤包括下载源码、使用Visual Studio 2022编译、调整配置、安装库文件和头文件，以及重新配置和编译FFmpeg以启用libuavs3d。

# 视觉智能开放平台 # 编解码 # 5G # Linux # 开发工具 # Windows

aqi00

|

博文

|

来自：视觉智能

FFmpeg开发笔记（三十六）Linux环境安装SRS实现视频直播推流

《FFmpeg开发实战》书中第10章提及轻量级流媒体服务器MediaMTX，适合测试RTSP/RTMP协议，但不适合生产环境。推荐使用SRS或ZLMediaKit，其中SRS是国产开源实时视频服务器，支持多种流媒体协议。本文简述在华为欧拉系统上编译安装SRS和FFmpeg的步骤，包括安装依赖、下载源码、配置、编译以及启动SRS服务。此外，还展示了如何通过FFmpeg进行RTMP推流，并使用VLC播放器测试拉流。更多FFmpeg开发内容可参考相关书籍。

# 视频直播 # 视觉智能开放平台 # Web App开发 # 缓存 # Linux # 视频直播

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

SAM 2.1：Meta 开源的图像和视频分割，支持实时视频处理

SAM 2.1是由Meta（Facebook的母公司）推出的先进视觉分割模型，专为图像和视频处理设计。该模型基于Transformer架构和流式记忆设计，实现了实时视频处理，并引入了数据增强技术，提升了对视觉相似物体和小物体的识别能力。SAM 2.1的主要功能包括图像和视频分割、实时视频处理、用户交互式分割、多对象跟踪以及改进的遮挡处理能力。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # Linux # API # Windows

赣州云智科技的技术铺子

|

博文

|

来自：视觉智能

【一步步开发AI运动小程序】十六、AI运动识别中，如何判断人体站位？

【云智AI运动识别小程序插件】提供人体、运动及姿态检测的AI能力，本地引擎无需后台支持，具备快速、体验好、易集成等优势。本文介绍如何利用插件的`camera-view`功能，通过检测人体站位视角（前、后、左、右），确保运动时的最佳识别率和用户体验。代码示例展示了如何实现视角检查，确保用户正或背对摄像头，为后续运动检测打下基础。

# 视觉智能开放平台 # 人工智能 # 小程序 # UED

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

StereoCrafter：腾讯开源将任意2D视频转换为立体3D视频的框架，适用于Apple Vision Pro等多种显示设备

StereoCrafter 是腾讯开源的框架，能够将单目2D视频转换为高保真度的立体3D视频，适用于多种显示设备。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 并行计算 # 数据处理

老乡别走

|

博文

|

来自：视觉智能

如何使用OCR技术批量识别图片中的文字并重命名文件，OCR 技术批量识别图片中的文字可能出现的错误

### 简介【批量识别图片内容重命名】工具可批量识别图片中的文字并重命名文件，方便高效处理大量图片。然而，OCR 技术面临字符识别错误（如形近字混淆、生僻字识别不佳）、格式错误（段落错乱、换行问题）和语义理解错误等挑战。为提高准确性，建议提升图片质量、选择合适的 OCR 软件及参数，并结合自动校对与人工审核，确保最终文本的正确性和完整性。

# 视觉智能开放平台 # 编解码 # 文字识别 # 自然语言处理 # 数据安全/隐私保护

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

DiffuEraser：阿里通义实验室推出的视频修复模型，支持高清修复、时间一致性优化

DiffuEraser 是阿里通义实验室推出的基于稳定扩散模型的视频修复工具，能够生成丰富的细节并保持时间一致性，适用于电影修复、监控增强等场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 监控 # 网络架构

未来智能研习社

|

7月前

|

博文

|

来自：视觉智能

用 Nano Banana Pro 批量生成城市天气视觉卡片

本文介绍如何用Nano Banana Pro批量生成统一风格的城市天气视觉卡片。通过结构化Prompt模版，固定视角、构图与尺寸（1080×1080），结合等距3D卡通风格，将北京、上海等城市的天气信息（晴/阴/雨/夜）转化为直观、稳定的视觉内容，适用于内容平台、城市账号或系统看板，实现高效复用与扩展。

# 视觉智能开放平台

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台