11月AI能力全新升级,让天下没有难做的视觉智能

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
简介: 11月视觉AI能力接口迭代更新已到,请查收~

阿里云视觉智能开放平台致力于为社会开发者提供便捷,成熟的视觉AI能力。平台聚合了阿里集团140+视觉AI能力,并且免费开放给社会公众使用,每一项能力都沉淀自阿里系精品应用,如盒马鲜生,支付宝,淘宝,优酷等。并且,将持续为其更新迭代,欢迎使用~https://vision.aliyun.com/

本月能力升级名单:

人脸人体

》动作行为识别
》人脸属性识别
》人体检测

视频生产

》视频字幕擦除

目标检测

》物体检测

详细:

人脸人体类目

动作行为识别:可识别静态与动态的人体姿势与动作行为,包括:举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒等。适用于健康护理、网课监管、安防监控等场景。

新增:洗手,拍照;优化暗光红外场景,应用于博物馆,美术馆违规行为监控等场景。

体验调试地址:
https://vision.aliyun.com/experience/detail?&tagName=facebody&children=RecognizeAction
动作行为识别.jpg

人脸属性识别:输入已获授权的图片可识别图片中人的性别、年龄、是否佩戴眼镜、人脸表情等属性,在公开测试集lfw上达到了业内排名前三的识别精度。适用于电商营销、身份验证等场景。

新增:颜值、质量、帽子、眼镜,应用于互动营销,小程序游戏等场景制作。

体验调试地址:
https://vision.aliyun.com/experience/detail?&tagName=facebody&children=RecognizeFace
人脸属性识别.jpg

人体检测:可识别图像中人体的坐标、人体数量等信息,适用于人体技术、人体识别、人流量统计等场景。

提升:各场景的准确率和召回率显著提升。应用与景区园区的人员管控,降低火车站,飞机场等公共场所人员风险。

体验调试地址:
https://vision.aliyun.com/experience/detail?&tagName=facebody&children=DetectPedestrian
人体检测.jpg

视频生产类目

视频字幕擦除:擦除视频中的“标准”字幕,如电影电视剧中下方的白色字幕,辅助视频制作。
优化:时序上擦除更加稳定,减少误擦和漏擦。

体验调试地址:
https://vision.aliyun.com/experience/detail?&tagName=videoenhan&children=EraseVideoSubtitles
视频字幕擦除.jpg

目标检测类目

物体检测:检测图像中的物体。可识别90类物体,例如:人体、椅子、篮球、摩托车、旗帜、斑马等。适用于3D建模,你画我猜等场景应用。
提升:检测速度提升,单服务qps从5变到15左右

体验调试地址:
https://vision.aliyun.com/experience/detail?&tagName=objectdet&children=DetectObject
物体检测.jpg

相关文章
|
7天前
|
人工智能 自然语言处理 安全
【2025】世界顶级AI模型本地部署私有化完整版教程 DeepSeek-R1+Ollama+ChatboxAI合体,瞬间升级你的个人电脑秒变智能神器!
震撼发布!让你的电脑智商飙升,DeepSeek-R1+Ollama+ChatboxAI合体教程,打造私人智能神器!
245 42
【2025】世界顶级AI模型本地部署私有化完整版教程 DeepSeek-R1+Ollama+ChatboxAI合体,瞬间升级你的个人电脑秒变智能神器!
|
2天前
|
人工智能 JavaScript 测试技术
通义灵码 2.0 体验报告:AI 赋能智能研发的新范式
通义灵码 2.0 是阿里云基于通义大模型推出的先进开发工具,具备代码智能生成、研发问答、多文件修改和自主执行等核心功能。本文通过亲身体验,展示了其在新功能开发、跨语言编程和单元测试生成等方面的实际效果,并对比了 1.0 版本的改进。结果显示,2.0 版在代码生成完整度、跨语言支持和单元测试自动化上有显著提升,极大提高了开发效率,但仍需进一步优化安全性和个性化风格。推荐指数:⭐⭐⭐⭐⭐。
|
2天前
|
人工智能 JavaScript 测试技术
通义灵码 2.0 体验报告:AI 赋能智能研发的新范式
**通义灵码 2.0 体验报告:AI 赋能智能研发的新范式** 本文详细评测了阿里云推出的通义灵码 2.0,基于通义大模型,提供代码智能生成、研发问答、多文件修改等核心能力。通过亲身体验,探讨其在新功能开发、跨语言编程、单元测试生成等场景的实际效果,并对比1.0版本的改进点。结果显示,2.0版本在代码生成完整性、自动化程度及跨语言支持方面有显著提升,但也存在安全性优化和个性化风格调整的空间。推荐指数:⭐⭐⭐⭐⭐。 (239字)
|
4天前
|
人工智能 JSON 自然语言处理
AI 程序员的4个分身 | 代码生成专家+注释精灵+API集成助手+智能调试伙伴
AI 程序员的4个分身 | 代码生成专家+注释精灵+API集成助手+智能调试伙伴
107 35
|
18天前
|
机器学习/深度学习 人工智能 运维
AI辅助的运维风险预测:智能运维新时代
AI辅助的运维风险预测:智能运维新时代
122 19
AI辅助的运维风险预测:智能运维新时代
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
Baichuan-M1-14B 是百川智能推出的首个开源医疗增强大模型,专为医疗场景优化,支持多语言、快速推理,具备强大的医疗推理能力和通用能力。
169 16
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
|
1月前
|
人工智能 自然语言处理 程序员
通义灵码2.0全新升级,AI程序员全面开放使用
通义灵码2.0来了,成为全球首个同时上线JetBrains和VSCode的AI 程序员产品!立即下载更新最新插件使用。
1941 27
通义灵码2.0全新升级,AI程序员全面开放使用
|
6天前
|
机器学习/深度学习 人工智能 监控
AI视频监控在大型商场的智能技术方案
该方案通过目标检测与姿态识别技术(如YOLO、OpenPose),实时监控顾客行为,识别异常动作如夹带物品、藏匿商品等,并结合AI模型分析行为模式,防止偷窃。出口处设置结算验证系统,比对结算记录与视频信息,确保商品全部支付。多角度摄像头和数据交叉验证减少误报,注重隐私保护,提升安保效率,降低损失率,增强顾客信任。
45 15
|
1月前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
72 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
1月前
|
存储 人工智能 自然语言处理
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
AI Agent以自主性和智能化为核心,适合复杂任务的动态执行;而SaaS工具则注重服务的完整性和易用性,适合标准化业务需求。
125 14
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式

热门文章

最新文章