【沙龙实况】图像的秘密·开发者沙龙

本文涉及的产品
票据凭证识别,票据凭证识别 200次/月
个人证照识别,个人证照识别 200次/月
通用文字识别,通用文字识别 200次/月
简介:

提起图像识别,你想到什么?本周六下午两点,雷锋网(公众号:雷锋网)联手汉王云主办的《图像的秘密·图像识别开发者沙龙》在中关村贝塔咖啡热烈上演。

来自汉王云的首席架构师虞文明、海康萤石的产品经理孙杰、云视智通郭春雪、骏聿科技刘海林、WRTnode罗未、美咖相机的毛明杰,以及汉王的人脸识别大咖黄磊博士分别在沙龙上做了分享。这其中有前沿技术研究的专家,面向开发者的底层技术服务,也有前端应用,有平台有硬件。

以下是沙龙上与会嘉宾的主题分享:

汉王云:让识别触手可及

汉王云的首席架构师虞文明首先介绍了汉王多年的一些识别技术,比如手写识别、OCR识别、人脸识别等。在过去十多年里,汉王在模式识别的技术上有深厚的积累,推出了层出不穷的软硬件产品,开创了宏大的识别硬件市场,给人们带来了方便。如今汉王云将这些成熟的识别技术逐渐以云服务API的方式提供给开发者。通过汉王云,开发者可以进行名片,手写,数学公式,拍照题目,纯文本,票据,文字表格,人脸定位,人脸年龄,人脸表情,人脸性别的多种识别。汉王云针对个人开发者和小微企业的移动终端访问提供免费服务。

随后,汉王云的胡云辉同学针对开放平台演示了如何快速调用汉王模式识别的API。嗯,这位85后的技术哥业务是相当熟练,讲解飞快,识别效果亦是立竿见影。

【沙龙实况】图像的秘密·开发者沙龙

随后在现场积极的互动中,虞总也向开发者们详细介绍了汉王云和汉王识别技术的一些特点:比如开发者们可以基于现成的手写识别(单字识别、行识别)开发游戏;而相比一些同样深耕于OCR识别的技术公司,汉王的主要优势是专精于汉字的识别;在识别效果上,由于OCR识别对输入图片有较高的要求,汉王会通过多种SDK辅助处理的方式来改善图片质量,在识别效果上汉王也会配合开发者一起获取更好的识别效果。

OCR之外,现场亦有开发者十分关心汉王的人脸识别技术。对此汉王的人脸识别专家黄磊博士告诉我们,目前国际上人脸识别较大的难点在用户不同姿态和光照条件下的识别,所以对一些精度要求非常高的情境(比如公安领域的黑名单比对),国际上还没有非常完善的解决方案。而汉王在人脸上的突破主要在两方面:

第一,黄博士带领的团队做了国际上第一款红外人脸识别系统;
其次是汉王同样在主力研发一些针对精度要求并不那么高,但应用广泛的领域,比如娱乐业、比如智能电视等等。

虞总表示,汉王云的开发者服务目前针对小微企业和个人开发者免费。待这些公司的业务发展到一定阶段后,还可以可以展开更加灵活的商业合作模式。

海康萤石:让商户更好地了解顾客

海康萤石做的是,通过基于图像的商户客流识别技术,来帮助大型商场更好地了解顾客。比如,通过空间热度图得到某个区域的客流数据和分布,商户可借此优化商品布局等。另外,还可以识别顾客身份、识别场景中的运动目标进行防盗等。

【沙龙实况】图像的秘密·开发者沙龙

云视智通:炫酷的智能眼镜

下面是一位女程序猿上场啦,来自云视智通的郭春雪。看,她一上台就开始调侃自己:你们大家看到我没有穿高跟鞋、没有化妆,就知道我是一名女程序猿了。哈哈,为了讲解未来智能眼镜的应用场景,她居然还借用了天猫的广告语——在未来,所见即所得。哼,这样也行?

【沙龙实况】图像的秘密·开发者沙龙

WRTnode:没有交互才是最好的交互

罗未是雷锋网的老朋友了,我们以前举办路由器、OpenWRT等锋会现场都有他的影子。他们会提供从硬件到开发环境的服务,希望在这些领域做一个基础设备提供商。罗未还展示了他们“天生骄傲”的开发板,同时也不忘装一下情怀:“你们能看到我的头发很长,所以能体会到我是很有情怀的人,同时我又非常的人文,还会敲代码,所以是走在科技与人文的十字路口。”

【沙龙实况】图像的秘密·开发者沙龙

美咖相机:让照“骗”飞

现今各种美颜相机的出现,导致妹子的自拍图“掺假”严重,广大男同胞也因此练就了火眼金睛,轻而易举就能看出哪个是美化过的。怎么办呢,美咖相机就基于人脸识别技术实现了看起来不那么假的美化效果。

毛明杰说,大多滤镜美化经常会把背景也处理了,比如使用瘦脸功能时,如果背景有一个墙角,那么瘦脸的同时也会把墙壁拉歪,看起来非常不真实。而依靠人脸识别技术就能限定好五官轮廓的位置,只美化关键部位,这样不会被人察觉。肿么样,妹子们喜欢吗?

【沙龙实况】图像的秘密·开发者沙龙

 
 
 
 
  本文作者: 白腾飞

本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
数据采集 机器学习/深度学习 人工智能
中文竞技场大模型测评-龙虎榜
本次测评选取写作创作相关、代码相关、知识常识、中文游戏、人类价值观、NLP专业领域6大场景和20个细分维度,分别对通义Qwen-Chat-7B、凤凰Phoenix-7B、ChatGLM2-6B、moss-moon-003-sft等大模型进行了超过 200+ 道题的评测。测评旨在为大家提供有关这些模型在不同领域和维度上的表现,更好地选择适合自己需求的模型和应用,期待这次测评能够为AI模型领域的学习和研究提供有价值的参考和指导。
70289 5
|
机器学习/深度学习 人工智能 自然语言处理
五分钟带你了解ChatGPT的基本原理
五分钟带你了解ChatGPT的基本原理
1277 0
五分钟带你了解ChatGPT的基本原理
|
7月前
|
传感器 监控 大数据
指挥学校大数据系统解决方案
本系统集成九大核心平台,包括中心化指挥、数据处理、学生信息、反校园欺凌大数据、智慧课堂、学生行为综合、数据交换及其他外部系统云平台。通过这些平台,系统实现对学生行为、课堂表现、校园安全等多维度的实时监控与数据分析,为教育管理、执法机关、心理辅导等提供强有力的数据支持。特别地,反校园欺凌平台利用多种传感器和智能设备,确保及时发现并处理校园霸凌事件,保障学生权益。同时,系统还涵盖超市、食堂、图书馆、消防安全等辅助云平台,全面提升校园智能化管理水平。
|
7月前
|
机器学习/深度学习 编解码 算法
《深度剖析:生成对抗网络如何实现图像风格的细腻逼真迁移》
生成对抗网络(GAN)在图像风格迁移中展现出巨大潜力。GAN由生成器和判别器组成,通过对抗训练生成逼真图像。相比传统方法,GAN能自动学习深层特征,生成多样化、细腻的风格,并实现高效处理。关键技术如多尺度训练、注意力机制及损失函数优化进一步提升了效果。GAN已广泛应用于艺术创作、游戏开发和影视制作等领域,未来有望带来更多创新应用。
219 2
|
10月前
|
机器学习/深度学习 自然语言处理 前端开发
前端神经网络入门:Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速
本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络,包括前馈神经网络(FFNN)、深度神经网络(DNN)和循环神经网络(RNN)。通过简单的示例和代码,帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景,并简要介绍了卷积神经网络(CNN)的替代方案。
1345 1
|
机器学习/深度学习 人工智能 自然语言处理
AI基础知识
【9月更文挑战第3天】
900 7
|
并行计算 PyTorch 算法框架/工具
Pytorch:模型的保存/加载、并行化、分布式
Pytorch:模型的保存/加载、并行化、分布式
249 0
|
JavaScript Serverless Python
django web项目部署到阿里云函数计算平台
django web项目部署到阿里云函数计算平台   阿里云函数计算(FC),旨在帮助用户采用弹性伸缩、动态分配资源的方式,来执行业务逻辑.让用户无需购买部署服务器,无需考虑业务负载,就能快速搭建可处理高并发的后台服务.   基于WSGI标准的项目能够很方便的迁移至函数计算平台. 本文介绍如何将一个通用的django web项目,通过FC提供的fun命令行工具快速部署到FC平台。
5423 0
|
网络协议 测试技术 Shell
公网使用SSH远程登录macOS服务器【内网穿透】
公网使用SSH远程登录macOS服务器【内网穿透】
574 0
|
Ubuntu Linux Python
Ubuntu之Pycharm:Ubuntu系统内Pycharm安装的图文教程
Ubuntu之Pycharm:Ubuntu系统内Pycharm安装的图文教程
Ubuntu之Pycharm:Ubuntu系统内Pycharm安装的图文教程