视觉智能-最新-第42页-阿里云开发者社区

花开富贵111

|

API

|

问答

在视觉智能平台中人体检测定位的问题是,同一个图片,多次调用 api,会返回不同的坐标数据为什么？

302 0 0

花开富贵111

|

开发工具

|

问答

在视觉智能平台中这边想使用.NET版本的人脸核身SDK，请问.NET版本应该怎么使用？

146 1 0

花开富贵111

|

问答

在视觉智能平台中线上监考功能里面的屏幕检测适用于手机屏幕吗？

241 1 0

花开富贵111

|

问答

在视觉智能平台中抠图功能有没有什么参数能调抠图精准度，以上截图是咱们平台根其他抠图的对比？

181 1 0

花开富贵111

|

开发工具

|

问答

在视觉智能平台中这边调用交互式全图分割，按官方的 sdk 的例子写了，这应该是成功了对吧？

171 1 0

花开富贵111

|

计算机视觉

|

问答

在视觉智能平台中请问使用图像分割处理后，输出的图片能否自动加上白色底？

168 1 0

花开富贵111

|

问答

在视觉智能平台中试用这个服务后返回的结果也还是包含人脸的，我的理解应该是0且无人脸数据对吗？

150 1 0

花开富贵111

|

开发工具

|

问答

在视觉智能平台中sdk调用超化的时候报错未知的名称或服务，是什么原因？

1232 3 1

花开富贵111

|

问答

在视觉智能平台中假如我不调用五官定位，我能利用里面返回的质量分或者其他数据来验证这个人脸吗？

155 1 0

花开富贵111

|

PHP

|

问答

在视觉智能平台中安装alibabacloud/ocr-20191230 报错是什么问题呢？

350 2 0

花开富贵111

|

问答

在视觉智能平台中想问下人脸比对1:1相关问题，这种示例是什么情况？

149 1 0

长发和小虎牙

|

机器学习/深度学习编解码算法

|

博文

YOLOv5改进 | 主干网络 | 用EfficientNet卷积替换backbone【教程+代码】

在YOLOv5的GFLOPs计算量中，卷积占了其中大多数的比列，为了减少计算量，研究人员提出了用EfficientNet代替backbone。本文给大家带来的教程是**将原来的主干网络替换为EfficientNet。文章在介绍主要的原理后，将手把手教学如何进行模块的代码添加和修改，并将修改后的完整代码放在文章的最后，方便大家一键运行，小白也可轻松上手实践。以帮助您更好地学习深度学习目标检测YOLO系列的挑战。

1287 3 4

花开富贵111

|

问答

在视觉智能平台中通用生成视频怎么才能保持原有的视频以及怎么加音乐？

183 1 0

wenti

|

文字识别

|

问答

文字识别OCR中，反馈一个BUG：国际护照OCR识别有个汉字识别总是出错，请排查下。

257 1 0

wenti

|

文字识别

|

问答

文字识别OCR中，图片倒着上传，能识别图片的旋转角度吗？

243 1 0

wenti

|

文字识别

|

问答

文字识别OCR中，这两个在哪里？怎么找不到？

113 1 0

wenti

|

文字识别应用服务中间件 nginx

|

问答

文字识别OCR中，身份证背面识别返回如下，为什么？

248 1 0

wenti

|

文字识别

|

问答

文字识别OCR中，支持拍照搜题吗？

184 0 0

wenti

|

文字识别

|

问答

文字识别OCR中，有张发票识别不了，可以找谁处理？

184 1 0

wenti

|

文字识别数据格式 JSON

|

问答

文字识别OCR中，QT的车牌识别，接收的阿里云的数据是空的，为什么？

187 0 0

wenti

|

文字识别开发工具

|

问答

文字识别OCR中，离线 SDK 怎么收费，麻烦介绍下？

187 1 0

wenti

|

文字识别

|

问答

文字识别OCR中没有图片识字这种场景吗？

206 1 0

wenti

|

文字识别

|

问答

文字识别OCR中，这张图片里的发票的日期，总是被识别错误成224-05-14

202 0 0

wenti

|

文字识别 Android开发小程序

|

问答

文字识别OCR中，目前离线OCR，有哪些平台SDK？ IOS,Android,鸿蒙，小程序，H5？

239 1 0

wenti

|

文字识别

|

问答

文字识别OCR中，类似这种识别不出来应该怎么处理呢？

194 1 0

wenti

|

文字识别监控

|

问答

文字识别OCR中，有详细的日志分析吗？

161 0 0

wenti

|

文字识别

|

问答

文字识别OCR中，如何在没有外网的环境下使用OCR，有解决方案吗？

178 1 0

wenti

|

文字识别

|

问答

请问有文字识别ocr输出格式为xlsx的代码么？

238 1 0

wenti

|

文字识别

|

问答

文字识别OCR中，阿里云市场里的营业执照OCR识别和阿里云里的OCR识别有什么区别？

236 1 0

wenti

|

文字识别开发工具

|

问答

文字识别OCR集成增值税发票识别接口时，按照调用示例给的SDK示例调用，发现接口调用的是OCR统一识

230 1 0

wenti

|

文字识别

|

问答

文字识别OCR这个产品有离线版本吗？

149 1 0

wenti

|

文字识别开发工具

|

问答

文字识别OCR集成增值税发票识别接口时，为什么调用的不是增值税发票识别接口？

202 1 0

wenti

|

文字识别

|

问答

文字识别OCR横向拍照的图片识别不了？需要手工旋转再识别？

234 1 0

wenti

|

文字识别

|

问答

文字识别OCR创建了一个自定义表格模板，然后在线使用的时候，一直报错啊，为什么？

149 1 0

wenti

|

文字识别

|

问答

文字识别OCR同一张图片多次调用，前几次都正常，但有一次会报错，为什么？

162 1 0

长发和小虎牙

|

机器学习/深度学习算法固态存储

|

博文

深度学习算法工程师面试问题总结| 深度学习目标检测岗位面试总结

本文给大家带来的百面算法工程师是深度学习目标检测岗位面试总结，文章内总结了常见的提问问题，旨在为广大学子模拟出更贴合实际的面试问答场景。在这篇文章中，我们还将介绍一些常见的深度学习目标检测面试问题，并提供参考的回答及其理论基础，以帮助求职者更好地准备面试。通过对这些问题的理解和回答，求职者可以展现出自己的深度学习目标检测领域的专业知识、解决问题的能力以及对实际应用场景的理解。同时，这也是为了帮助求职者更好地应对深度学习目标检测岗位的面试挑战，提升面试的成功率和竞争力。

970 3 3

长发和小虎牙

|

机器学习/深度学习编解码算法

|

博文

算法工程师面试问题总结 | YOLOv5面试考点原理全解析

本文给大家带来的百面算法工程师是深度学习目标检测YOLOv5面试总结，文章内总结了常见的提问问题，旨在为广大学子模拟出更贴合实际的面试问答场景。在这篇文章中，我们还将介绍一些常见的深度学习目标检测面试问题，并提供参考的回答及其理论基础，以帮助求职者更好地准备面试。通过对这些问题的理解和回答，求职者可以展现出自己的深度学习目标检测领域的专业知识、解决问题的能力以及对实际应用场景的理解。同时，这也是为了帮助求职者更好地应对深度学习目标检测岗位的面试挑战，提升面试的成功率和竞争力。

3314 4 5

长发和小虎牙

|

机器学习/深度学习编解码边缘计算

|

博文

YOLOv5改进 | 卷积模块 | 用ShuffleNetV2卷积替换Conv【轻量化网络】

本文介绍了如何在YOLOv5中用ShuffleNetV2替换卷积以减少计算量。ShuffleNetV2是一个轻量级网络，采用深度可分离卷积、通道重组和多尺度特征融合技术。文中提供了一个逐步教程，包括ShuffleNetV2模块的代码实现和在YOLOv5配置文件中的添加方法。此外，还分享了完整的代码链接和GFLOPs的比较，显示了GFLOPs的显著减少。该教程适合初学者实践，以提升深度学习目标检测技能。

1381 7 7

长发和小虎牙

|

机器学习/深度学习编解码算法

|

博文

YOLOv5改进 | 主干网络 | 将backbone替换为MobileNetV3【小白必备教程+附完整代码】

本文介绍了将YOLOv5的backbone替换为MobileNetV3以提升目标检测性能的教程。MobileNetV3采用倒残差结构、Squeeze-and-Excitation模块和Hard-Swish激活函数，实现更高性能和更低计算成本。文中提供了详细的代码实现，包括MobileNetV3的关键组件和YOLOv5的配置修改，便于读者实践。此外，还分享了完整代码链接和进一步的进阶策略，适合深度学习初学者和进阶者学习YOLO系列。

1736 7 8

aqi00

|

编解码 Linux 5G

|

博文

FFmpeg开发笔记（二十）Linux环境给FFmpeg集成AVS3解码器

AVS3，中国制定的第三代音视频标准，是首个针对8K和5G的视频编码标准，相比AVS2和HEVC性能提升约30%。uavs3d是AVS3的解码器，支持8K/60P实时解码，且在各平台有优秀表现。要为FFmpeg集成AVS3解码器libuavs3d，需从GitHub下载最新源码，解压后配置、编译和安装。之后，重新配置FFmpeg，启用libuavs3d并编译安装，通过`ffmpeg -version`确认成功集成。

1086 0 0

来自：视频分割版块

aqi00

|

存储缓存调度

|

博文

FFmpeg开发笔记（十九）FFmpeg开启两个线程分别解码音视频

《FFmpeg开发实战》第10章示例playsync.c在处理音频流和视频流交错的文件时能实现同步播放，但对于分开存储的格式，会出现先播放全部声音再快速播放视频的问题。为解决此问题，需改造程序，增加音频处理线程和队列，以及相关锁，先将音视频帧读入缓存，再按时间戳播放。改造包括声明新变量、初始化线程和锁、修改数据包处理方式等。代码修改后在playsync2.c中，编译运行成功，控制台显示日志，SDL窗口播放视频并同步音频，证明改造有效。

610 0 0

来自：视频分割版块

蓝易云

|

Linux Docker 容器

|

博文

查看主机上是否有docker - 蓝易云

如果Docker已经安装，这个命令将返回Docker的版本信息。如果没有安装Docker，系统将返回一个错误消息。

500 4 4

真的很搞笑

|

文字识别 API 开发工具

|

博文

印刷文字操作报错合集之报错403如何解决

在使用印刷文字识别（OCR）技术过程中，可能会遇到各种错误或问题。以下是一些常见的报错情况及其可能的原因和解决建议。包括但不限于：1.识别率低，错误多、2.无法识别特定字符或字体、3.文件格式不支持、4.内存或资源不足、5.网络连接问题、6.API调用限制或授权问题、7.语言识别错误、8.安全与隐私问题。

364 0 0

来自：文字识别版块

真的很搞笑

|

文字识别算法 Java

|

博文

印刷文字识别产品使用合集之证件规格不统一，可以用全文识别吗

印刷文字识别（Optical Character Recognition, OCR）技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域，以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。

220 0 0

来自：文字识别版块

真的很搞笑

|

编解码文字识别安全

|

博文

印刷文字操作报错合集之出现“图片和服务类型不匹配”，该怎么解决

在使用印刷文字识别（OCR）技术过程中，可能会遇到各种错误或问题。以下是一些常见的报错情况及其可能的原因和解决建议。包括但不限于：1.识别率低，错误多、2.无法识别特定字符或字体、3.文件格式不支持、4.内存或资源不足、5.网络连接问题、6.API调用限制或授权问题、7.语言识别错误、8.安全与隐私问题。

1159 0 0

来自：文字识别版块

真的很搞笑

|

文字识别

|

博文

印刷文字识别产品使用合集之证件扫描的置信度字段，这个有什么用

印刷文字识别（Optical Character Recognition, OCR）技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域，以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。

224 0 0

来自：文字识别版块

真的很搞笑

|

JSON 文字识别 API

|

博文

印刷文字操作报错合集之出现错误码13525表示什么意思

在使用印刷文字识别（OCR）技术过程中，可能会遇到各种错误或问题。以下是一些常见的报错情况及其可能的原因和解决建议。包括但不限于：1.识别率低，错误多、2.无法识别特定字符或字体、3.文件格式不支持、4.内存或资源不足、5.网络连接问题、6.API调用限制或授权问题、7.语言识别错误、8.安全与隐私问题。

432 2 2

来自：文字识别版块

最新

通义万相

官方博客

问答

视频

在视觉智能平台中人体检测定位的问题是,同一个图片,多次调用 api,会返回不同的坐标数据为什么？

在视觉智能平台中这边想使用.NET版本的人脸核身SDK，请问.NET版本应该怎么使用？

在视觉智能平台中线上监考功能里面的屏幕检测适用于手机屏幕吗？

在视觉智能平台中如图所示如何解决？

在视觉智能平台中这两个图像ai审核有什么区别？

在视觉智能平台中抠图功能 有没有什么参数能调抠图精准度，以上截图是咱们平台根其他抠图的对比？

在视觉智能平台中这边调用交互式全图分割，按官方的 sdk 的例子写了，这应该是成功了对吧？

在视觉智能平台中请问使用图像分割处理后，输出的图片能否自动加上白色底？

在视觉智能平台中试用这个服务后返回的结果也还是包含人脸的 ，我的理解应该是0且无人脸数据对吗？

在视觉智能平台中sdk调用超化的时候报错未知的名称或服务 ，是什么原因？

在视觉智能平台中如图所示这种错误如何定位？

在视觉智能平台中假如我不调用五官定位，我能利用里面返回的质量分或者其他数据来验证这个人脸吗？

在视觉智能平台中安装alibabacloud/ocr-20191230 报错是什么问题呢？

在视觉智能平台中想问下人脸比对1:1相关问题，这种示例是什么情况？

YOLOv5改进 | 主干网络 | 用EfficientNet卷积替换backbone【教程+代码 】

在视觉智能平台中通用生成视频怎么才能保持原有的视频以及怎么加音乐？

文字识别OCR中，反馈一个BUG：国际护照OCR识别有个汉字识别总是出错，请排查下。

文字识别OCR中，图片倒着上传，能识别图片的旋转角度吗？

文字识别OCR中，这两个在哪里？怎么找不到？

文字识别OCR中，身份证背面 识别返回如下，为什么？

文字识别OCR中，支持拍照搜题吗？

文字识别OCR中，有张发票识别不了，可以找谁处理？

文字识别OCR中，QT的车牌识别，接收的阿里云的数据是空的，为什么？

文字识别OCR中，离线 SDK 怎么收费，麻烦介绍下？

文字识别OCR中没有图片识字这种场景吗？

文字识别OCR中，这张图片里的发票的日期，总是被识别错误成224-05-14

文字识别OCR中，目前离线OCR，有哪些平台SDK？ IOS,Android,鸿蒙，小程序，H5？

文字识别OCR中，类似这种识别不出来应该怎么处理呢？

文字识别OCR中，有详细的日志分析吗？

文字识别OCR中，如何在没有外网的环境下使用OCR，有解决方案吗？

请问有文字识别ocr输出格式为xlsx的代码么？

文字识别OCR中，阿里云市场里的营业执照OCR识别和阿里云里的OCR识别有什么区别？

文字识别OCR集成增值税发票识别接口时，按照调用示例给的SDK示例调用，发现接口调用的是OCR统一识

文字识别OCR这个产品有离线版本吗？

文字识别OCR集成增值税发票识别接口时，为什么调用的不是增值税发票识别接口？

文字识别OCR横向拍照的图片 识别不了？需要手工旋转再识别？

文字识别OCR创建了一个自定义表格模板，然后在线使用的时候，一直报错啊，为什么？

文字识别OCR同一张图片多次调用，前几次都正常，但有一次会报错，为什么？

深度学习算法工程师面试问题总结| 深度学习目标检测岗位面试总结

算法工程师面试问题总结 | YOLOv5面试考点原理全解析

YOLOv5改进 | 卷积模块 | 用ShuffleNetV2卷积替换Conv【轻量化网络】

YOLOv5改进 | 主干网络 | 将backbone替换为MobileNetV3【小白必备教程+附完整代码】

FFmpeg开发笔记（二十）Linux环境给FFmpeg集成AVS3解码器

FFmpeg开发笔记（十九）FFmpeg开启两个线程分别解码音视频

查看主机上是否有docker - 蓝易云

印刷文字操作报错合集之报错403如何解决

印刷文字识别产品使用合集之证件规格不统一，可以用全文识别吗

印刷文字操作报错合集之出现“图片和服务类型不匹配”，该怎么解决

印刷文字识别产品使用合集之证件扫描的置信度字段，这个有什么用

印刷文字操作报错合集之出现错误码13525表示什么意思

视觉智能

活跃用户

相关产品

在视觉智能平台中抠图功能有没有什么参数能调抠图精准度，以上截图是咱们平台根其他抠图的对比？

在视觉智能平台中试用这个服务后返回的结果也还是包含人脸的，我的理解应该是0且无人脸数据对吗？

在视觉智能平台中sdk调用超化的时候报错未知的名称或服务，是什么原因？

YOLOv5改进 | 主干网络 | 用EfficientNet卷积替换backbone【教程+代码】

文字识别OCR中，身份证背面识别返回如下，为什么？

文字识别OCR横向拍照的图片识别不了？需要手工旋转再识别？