视觉智能开放平台

首页 标签 视觉智能开放平台
|
4天前
| |
来自: 视觉智能
历史科普视频的AI自动化生产工作流:从全手动到半自动的工程演进
本文量化历史科普视频制作瓶颈,对比全手动(Stable Diffusion/GPT-SoVITS/Manim等开源栈)与半自动(花生AI为核心)方案。实测混合工作流将单期耗时从29–49小时压缩至10–15小时,效率提升60%+,兼顾质量、可控性与落地性。
|
7天前
| |
来自: 视觉智能
AI短剧/AI广告生成实战流程:阿里云百炼新上线的HappyHorse 1.1功能详解、参数调试、成本指南
HappyHorse是阿里云推出的端到端AI视频生成大模型,2026年6月22日正式上线迭代版本HappyHorse 1.1,部署在阿里云百炼平台对外开放API调用与在线调试能力,主打短剧、电商广告、品牌宣传片、内容营销短片四大商用内容场景。相比初代HappyHorse 1.0,新版本在动态时序、角色一致性、画面质感、音画协同、长指令理解五大核心维度完成系统性升级,解决旧版动作僵硬、人物面部失真、多角色画面互相污染、长分镜逻辑断裂等行业常见痛点。
|
12天前
| |
来自: 视觉智能
Ж-CEH:锚定结构存在论—— 从宇宙虚无到视觉张量的统一框架
陈恩华提出“锚定结构存在论”,定义核心算符Ж(观察者坍缩筛)与锚定存在方程,首创Ж-CEH算法,突破强光干扰下边缘检测难题:FP压制率达83%~89%,F1仅降2.3%,1帧恢复。实现工业视觉从“依赖光源”到“遵循物理规律”的范式跃迁。
|
20天前
| |
来自: 视觉智能
一线互联 × Rokid AI眼镜:为什么它是工业4.0时代一线人员的标准装备?
Gartner预测:2027年30%工业企业将为一线员工标配AI眼镜(2023年仅5%)。Rokid灵伴眼镜+一线互联jLink,以轻量化硬件、5G低延时网络与任务驱动型协作系统,实现远程指导、过程留痕、数据归档闭环,助力企业降本增效、沉淀数字资产。(239字)
|
20天前
| |
来自: 视觉智能
YOLO26如何涨点系列篇(NEU-DET缺陷检测) | CVPR2026 FAAFusion 解决Neck跨尺度方向冲突,实现涨点1.2%
在NEU-DET数据集下验证:原始mAP50原始为 0.722提升至 0.734 ,P 原始为  0.745 提升至   0.749, R 原始为 0.643 提升至0.665 , mAP50-95原始为0.407提升至 0.41
|
20天前
| |
来自: 视觉智能
Rokid AI 眼镜远程协作应用"一线互联"开发实践:设备发现与 BLE 扫描
工业现场蓝牙扫描远非简单“搜到即连”:需两级过滤(系统低延迟扫描+应用层UUID/名称匹配)、RSSI智能排序、MAC地址临时命名,并通过CXR私有协议建立专用连接,确保秒级稳定接入。
|
20天前
| |
来自: 视觉智能
"多路全景视频实时拼接融合"边缘计算网关几种拼接方式
本文介绍全景视频实时拼接融合边缘计算网关支持的四种前端摄像头机位部署结构:横向(180°水平)、纵向(大垂直视角)、环形外拼(360°全景)及穹顶形(最复杂)。强调需满足定焦镜头与画面重合度两大前提,目前网关已兼容前三种结构。
|
20天前
| |
来自: 视觉智能
2472.一款图片批量提取工具:从文章到图库,一招搞定素材管理_创建自己的永久免费图床
公号图床图片提取工具:一键批量提取微众号文章中的所有配图,智能识别防盗链、自动去重、支持纯链接/HTML/论坛格式输出,并可实时预览、本地批量保存,直链引用,操作极简,效率跃升。
|
20天前
| |
来自: 视觉智能
ECS GPU 上跑 vLLM:模型目录、镜像和 runtime 排查记录
本文记录ECS GPU环境部署vLLM时“容器运行但服务不ready”的排查过程。聚焦NAS模型挂载、Docker GPU透传、镜像预检、runtime配置及vLLM冷启动分层验证,避免将存储延迟误判为GPU或模型问题,提炼出7项可复用的GPU推理服务上线前检查清单。(239字)
免费试用