视觉智能开放平台的搜索结果_热门_第12页-阿里云开发者社区

1652126143653740

|

11月前

|

博文

|

软件是不自带美颜插件的，可以安装OBS-Studio-29.1.3安装包，就自带美颜功能的插件。在OBS软件【插件中心】菜单下,打开【打开插件中心】，安装美颜摄像头注册即可。在OBS软件【停靠窗口】菜单下，打开【美颜参数控制面板】的美颜窗口。插件里面有自带教程，可以自行学习。

# 视觉智能开放平台

未来智能研习社

|

7月前

|

博文

|

来自：视觉智能

# 用Prompt Engineering高效生成合规Amazon包类套图

利用Prompt Engineering，仅需1张实拍图+产品参数，即可高效生成符合Amazon美国站合规要求的包类套图。通过结构化提示词，明确主图、卖点、场景等6类图片职责，确保每张图精准传达信息，避免AI篡改产品细节，实现低成本、可复用、规模化出图，大幅提升上架效率。

# 视觉智能开放平台 # 人工智能

AI小怪兽

|

博文

|

来自：视觉智能

YOLO26如何训练自己的数据集 | （NEU-DET为案列）

本文详解YOLO26全新架构：移除DFL、端到端无NMS推理、ProgLoss+STAL损失策略及MuSGD优化器；并以NEU-DET数据集为例，详述训练全流程（含预训练/优化器选择/模型缩放对比），附结构图、代码与可视化结果。

# 视觉智能开放平台 # 机器学习/深度学习 # 数据可视化 # 测试技术 # 计算机视觉 # 人工智能

安之眼Agent

|

4月前

|

博文

|

来自：视觉智能

边缘AI算法在工业AR眼镜中的部署实践：从模型轻量化到端侧推理

本文分享AR眼镜端侧AI部署实践：针对工业无网/弱网、毫秒级响应需求，通过知识蒸馏+INT8量化+剪枝将模型压缩至<10MB；选用MNN引擎优化推理，实测仪表OCR（38ms/99.2%）、缺陷检测（42ms/98.7%）等任务均满足实时性与精度要求。

# 视觉智能开放平台 # 人工智能 # 算法 # vr&ar # 算法框架/工具 # TensorFlow

青城山下庄文杰

|

问答

|

来自： ModelScope模型即服务

请问Modelscope互联网如何访问Notebook的服务呢？

# 视觉智能开放平台

青城山下庄文杰

|

问答

|

来自： ModelScope模型即服务

ModelScope魔搭上的可以直接调用api用吗？

# 视觉智能开放平台 # API

汀丶人工智能

|

博文

|

来自：视觉智能

阿里视觉智能开放平台（灵杰AI开放服务）【评测】人脸活体检测、智能美肤、文字识别等功能很多等待你的开发

阿里视觉智能开放平台（灵杰AI开放服务）DetectLivingFace 人脸活体检测、智能美肤、文字识别等功能很多等待你的开发

# 文字识别 # 视觉智能开放平台 # 存储 # 机器学习/深度学习 # 人工智能 # 编解码 # 缓存 # 文字识别 # 安全 # 算法 # API # 计算机视觉

老乡别走

|

博文

|

来自：视觉智能

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术，可自动提取学生信息并录入Excel，便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤，包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南，帮助用户高效处理PDF文件。链接： - 百度网盘：[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘：[链接](https://share.weiyun.com/a77jklXK)

# 视觉智能开放平台 # 文字识别 # Serverless # 开发工具 # 对象存储 # Python

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

Hi3DGen是由香港中文大学、字节跳动和清华大学联合研发的高保真3D几何生成框架，通过法线图中间表示实现细节丰富的3D模型生成，其双阶段生成流程显著提升了几何保真度。

# 视觉智能开放平台 # 人工智能

zfhvx64ydb4r6

|

4月前

|

博文

|

来自：视觉智能

视频后期黑科技：深度拆解开源 VSR 架构与视频 Inpainting 实践全指南

本文深度解析视频补全（Video Inpainting）前沿技术，聚焦硬字幕去除工具VSR的底层架构（OCR定位、时序传播、光流对齐）、本地部署要点（CUDA环境、显存优化）及云端方案（550W AI扩散模型），对比二者在隐私、效率与画质上的差异，助力开发者科学选型。（239字）

# 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 文字识别 # 并行计算 # 开发者

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台