阿里云视觉训练-第二天

本文涉及的产品
企业资质识别,企业资质识别 200次/月
车辆物流识别,车辆物流识别 200次/月
个人证照识别,个人证照识别 200次/月
简介: 今天使用阿里云视觉平台API快速开发在线视觉AI平台,了解如何搭建身份证识别系统,从而扩展到其他的识别系统。

一、身份证识别

效果说明:用户上传图片,页面显示提取的相关信息。

二、系统的核心逻辑

1.利用SDK完成识别功能

OCR的SDK获取与使用
实现步骤:先打开视觉智能开放平台——文字识别——身份证识别——查看产品文档——SDK参考——在JAVA中提供两种SDK,分别是通用(需要提供OSS中的URL)和新版(支持本地文件上传)。
SDK获取与使用:先找到OCR的SDK,复制连接+OCR,现阶段使用1.0.3版本。

2.项目实现逻辑

前端讲解:页面包含要素介绍。
讲解控制器层:JAVA代码讲解。定义私有变量讲解,两个控制方法讲解。
讲解配置文件:修改目录。
讲解上传文件的地址
讲解调用实现逻辑

3.总结

根据老师的操作,初步的了解实现人工智能的逻辑!收获颇丰!明天加油!

目录
相关文章
|
10天前
|
数据采集 人工智能 自然语言处理
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
【8月更文挑战第29天】豆包大模型与香港大学团队合作研发的ByteCheckpoint系统,旨在应对大语言模型(LLM)开发中的数据规模庞大、计算资源昂贵及训练过程不稳定的挑战。该系统通过统一检查点机制、细粒度资源管理和多模态数据处理等创新技术,显著提升了LLM的训练效率和模型性能,并已在多个实际场景中取得显著效果。
23 4
|
2天前
|
自然语言处理 计算机视觉
给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA
【9月更文挑战第5天】近年来,视频大型语言模型(LLM)在计算机视觉领域取得显著进展,但高昂的监督微调成本成为瓶颈。苹果研究人员提出了免训练的SF-LLaVA模型,采用慢流(捕捉空间语义)和快流(捕捉时序上下文)的双流设计,能高效处理视频中的静态与动态信息,显著提升了开放性视频问答、多选视频问答及文本生成等任务的表现。然而,该模型在复杂视频场景理解和特定任务泛化能力方面仍有局限。论文详见:https://arxiv.org/pdf/2407.15841
8 1
|
2月前
|
机器学习/深度学习 并行计算 PyTorch
PyTorch | 加速模型训练的妙招
PyTorch | 加速模型训练的妙招
18 0
|
9月前
|
人工智能 自然语言处理 算法
|
编解码 数据可视化 物联网
基于 PPDiffusers 训练 AIGC 趣味模型【中国美食与花】
基于 PPDiffusers 训练 AIGC 趣味模型【中国美食与花】
117 0
|
机器学习/深度学习 机器人 计算机视觉
耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类
耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类
|
达摩院
三分钟视频|看懂达摩院语音降噪模型训练全过程
三分钟视频|看懂达摩院语音降噪模型训练全过程
176 0
|
语音技术
三分钟视频|看懂多情感语音合成模型训练过程
三分钟视频|看懂多情感语音合成模型训练过程
125 0
|
机器学习/深度学习 人工智能 算法
让大模型的训练和推理,比更快还更快!谷歌2022年终总结第四弹(1)
让大模型的训练和推理,比更快还更快!谷歌2022年终总结第四弹
142 0
|
机器学习/深度学习 存储 自然语言处理
让大模型的训练和推理,比更快还更快!谷歌2022年终总结第四弹(2)
让大模型的训练和推理,比更快还更快!谷歌2022年终总结第四弹
141 0
下一篇
DDNS