文字识别的搜索结果_文章_第4页-阿里云开发者社区

winx_19970108018

|

17天前

|

博文

|

taobao.item.search.img（拍立淘图片搜索 API)全业务场景手册

拍立淘按图搜商品（taobao.item.search.img）是阿里视觉AI接口，支持图片URL或Base64输入，精准返回同款/相似商品ID、标题、价格、销量等结构化数据，广泛应用于跨境铺货、比价导购、竞品监控、品牌维权、智能选品等六大场景。（239字）

# 人工智能 # 文字识别 # 监控 # 供应链 # API

AI大王Alex

|

20天前

|

博文

车位与车牌目标检测数据集：4类别 | 目标检测

本数据集含5000张真实停车场图像，标注4类目标（空位、已占用、违规停车、车牌），支持YOLO等主流模型训练，适用于智慧停车、违停检测等场景，助力无人值守停车场落地。（239字）

# 传感器 # 边缘计算 # 文字识别 # 计算机视觉 # AI芯片

IT小岛

|

20天前

|

博文

|

来自：千问大模型

Hawa Code Computer use 优化项

Hawa Code 的 Computer MCP 提供桌面自动化能力：通过截屏识别 UI 元素，支持点击、输入、滚动等操作；内置 key/type/click_element 等十余种精准控制工具，并兼容多平台无障碍 API 与 OCR。

# 大模型服务平台百炼 # 存储 # 编解码 # 文字识别 # API # iOS开发

Clawdbot

|

20天前

|

博文

|

来自：千问大模型

阿里云Qwen3.7-Plus全解析：核心能力、订阅方案与部署实操指南

阿里云Qwen3.7-Plus是通义千问系列面向智能体时代推出的均衡型多模态大模型，定位为“能看、能想、能动手”的端到端执行型智能体，在保持接近旗舰模型文本能力的同时，大幅强化视觉理解、GUI交互与任务闭环能力，兼顾性能与成本，是企业与个人构建多模态AI应用的高性价比选择。以下从核心功能、优惠订阅方案、部署实操三大维度，全面解析Qwen3.7-Plus的技术特性、计费策略与落地流程，帮助用户快速掌握模型使用与部署要点。

# 大模型服务平台百炼 # 人工智能 # 文字识别 # 前端开发 # API # Python

游客5nst5xm3lnu7k

|

21天前

|

博文

RPA 实战：滑块验证码、登录弹窗、动态页面通用处理方案

本文针对RPA自动化中三大顽疾——滑块验证码、登录弹窗、动态页面加载，提供经生产验证的实战方案：基于ddddocr实现高精度缺口识别与拟人化滑动轨迹；通过异常捕获+多 selector 智能弹窗感知；采用轮询检测+网络监听应对Ajax懒加载；辅以指纹浏览器、行为模拟与AI元素自愈，全面提升脚本鲁棒性与拟真度。

# 人工智能 # 文字识别 # 前端开发 # JavaScript # API

游客5nst5xm3lnu7k

|

22天前

|

博文

RPA OCR 文字识别实战：本地离线识别、发票 / 合同多模态信息提取

本文介绍了一套安全、低成本的本地离线OCR解决方案：基于PaddleOCR+国产RPA引擎，无需联网、不传数据，支持发票/合同多模态识别与结构化提取。适配普通办公电脑，模型仅30MB，可打包为EXE一键部署，兼顾金融/政务级数据安全与中小企业预算需求。

# 文字识别 # 人工智能 # 文字识别 # API # 数据安全/隐私保护 # Python

祁木CAD

|

23天前

|

博文

|

来自：阿里云百炼

祁木CAD Translator 原理拆解：基于百炼云技术的DWG/DXF工程图纸结构化翻译技术解析

本文解析DWG/DXF图纸结构化翻译技术，突破OCR识别不准、插件兼容差、人工效率低、通用AI误译等瓶颈；首创三层解耦架构，实现文本精准提取、术语智能保护、动态重排回填、多模式译文写入及本地离线私有化部署，支持中俄/中英/中西/中越等多语种批量高保真翻译，赋能设计院、工程外贸与涉密项目高效合规交付。

# 大模型服务平台百炼 # 人工智能 # 文字识别 # 自然语言处理 # 安全 # 数据安全/隐私保护

芦熙霖

|

23天前

|

博文

二维码钓鱼攻击演进与邮件安全多层防御体系研究

本文针对激增的二维码钓鱼（Quishing）攻击，系统梳理其三阶段演化及HTML虚拟码、ASCII字符码等新型规避技术，揭示传统邮件网关在图像解析、跨设备管控等方面的结构性缺陷；创新提出文本语义识别、多模态图像解析、URL动态校验三层联动防御架构，并提供轻量级Python实现，辅以技术改造、终端管控、情报协同与认知提升四维闭环治理方案。（239字）

# 人工智能 # 文字识别 # 安全 # Serverless # Python

芦熙霖

|

23天前

|

博文

电信入网人脸识别实名新规下活体抗欺诈多层风控体系研究

韩国2026年7月起实施手机入网人脸实名新规，强制人脸识别核验以遏制傀儡号黑产。本文剖析AI换脸、屏幕回放等新型欺骗攻击，指出单一人脸比对防御失效；提出证件OCR防伪、多模态活体检测、设备行为风控三层联动架构，并提供轻量化Python实现，兼顾安全与隐私合规。（239字）

# 人工智能 # 文字识别 # 安全 # Serverless # 计算机视觉

呼噜噜来了

|

24天前

|

博文

2026年AI融合RPA能替代哪些工作？企业财务运营自动化真实使用体验

2026年AI与RPA深度融合已成为企业自动化标配。本文从真实财务运营场景出发，深度拆解银行流水自动转凭证、发票OCR识别与三单匹配、银企对账、薪资核算与社保申报、费用报销自动化、财务报表自动生成等6类可自动化工作，结合149个核算主体对账革命等实战案例，分析页面改版中断、数据安全合规、多设备部署成本三大落地痛点及解法。并从AI融合深度、部署灵活性、生态对接能力、成本透明度、使用门槛五个维度，为企业提供2026年国产轻量型RPA选型参考。

# 人工智能 # 文字识别 # API # 数据安全/隐私保护 # 开发者

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别