阿里云视觉智能开放平台上新啦!100+视觉AI算法等你来调~

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频通用资源包5000点
视觉智能开放平台,图像通用资源包5000点
简介: 13大视觉AI类目,113种算法 有图有真相,先上图,看看咱们大平台上丰富多样的视觉AI算法!         据不完全统计,整个阿里巴巴集团有数千名开发人员围绕着视觉技术在电子商务、城市大脑、金融支付、交通物流、通信会议、新零售、文娱等多个行业的应用需求,不断贡献着各类技术创新与应用实践,形成了多个产品和解决方案。这其中沉淀了诸多视觉基础原子能力,

13大视觉AI类目,113种算法

有图有真相,先上图,看看咱们大平台上丰富多样的视觉AI算法!

        据不完全统计,整个阿里巴巴集团有数千名开发人员围绕着视觉技术在电子商务、城市大脑、金融支付、交通物流、通信会议、新零售、文娱等多个行业的应用需求,不断贡献着各类技术创新与应用实践,形成了多个产品和解决方案。这其中沉淀了诸多视觉基础原子能力,如何将这些算法能力去服务更广泛的用户和开发者群体,发挥更大的价值呢?由阿里巴巴集团技术委员会视觉技术小组和战略合作部牵头,达摩院联合阿里云产品与解决方案管理部以及集团各个视觉技术团队一起创建的阿里云视觉智能开放平台(https://vision.aliyun.com)应运而生,调用量已破千万!

        近期平台新增了30+种AI算法,其中更是包括了针对疫情防控开发的新冠病毒肺炎辅助诊断算法;可在多个场景应用的人脸比对1:N算法、以及针对视频进行处理分析的相关算法服务。

        春节前夕至今的一场肺炎病毒危机席卷了中国乃至整个世界。目前通过肺部ct的检测可迅速判断疑似患者的身体情况,但是由于疑似患者基数较大所以纯靠人工阅片,会耗费医生极大精力。为此我们携手达摩院联合出品 “新冠病毒肺炎辅助诊断”AI算法, 其最大的特点就是又快又准。它可以在20秒内完成一次CT诊断,最短仅2秒,准确率达96%以上!它可以帮助医生快速进行疑似病例诊断,让 AI 在抗击疫情中大显身手,让AI成为医生的助手,让一切变得有可能。

        如果您想要了解此算法的实现原理以及应用到的技术,可点击下方的文章链接查看。《让AI成为医生的助手,达摩院正在让一切变得可能》:https://www.atatech.org/articles/170333

        人脸是计算机视觉技术中应用最为广泛的人体器官。通过创建对应的人脸库,增加人脸数据,然后输入单张人脸图片,调用人脸搜索1:N算法,就会输出与人脸库中的人脸图片进行对比后的结果,人脸比对1:N算法可广泛 应用于企业人脸打卡、安防监控以及闸机刷脸通行等场景,实现刷脸门禁通行,解决忘带工牌、盗刷等问题。

        此外,我们还新增了多个和视频相关的算法。

        前有索尼大法好,后有人像分割大法好,本次上线了视频人像分割AI算法,通过此算法可对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域的mask(掩模)作为视频序列返回。可广泛应用于影视、泛文娱、个人应用等各种场景。例如视频直播过程中你看到的那些花里胡哨的特效,可能就是用到了这个算法,识别用户的人体轮廓,为人像实时增加各种设定的背景特效、贴纸道具,提供更加丰富的娱乐体验。

        不止是人像,我们还对视频里面的标志字幕下了手~通过使用视频标志擦除视频字幕擦除可以快速有效的擦除视频中的台标和字幕,可有效对视频做定向的优化和调整,主要可应用在影视作品当中,例如老电影里面的字幕比较模糊,可以通过此算法去除字幕然后再添加较为清晰的弹幕,以此优化观看者的观看体验。

        为了更好的帮助中小企业和独立开发者快速对接视觉AI算法,阿里云视觉智能开放平台(https://vision.aliyun.com)免费开放平台上现有的100余种视觉AI算法服务的使用权限,除新冠病毒肺炎辅助诊断算法外,其他算法调用不收取任何费用!目前平台整体对外部客户赋能,欢迎外部客户前来咨询调用!

 

目录
打赏
0
0
0
0
36
分享
相关文章
HarmonyOS NEXT AI基础视觉服务-背景替换
这是一个基于AI基础视觉服务的背景替换案例,通过调用设备相册选择图片并智能分割主体,支持动态更换背景颜色。主要步骤包括:1) 导入模块与定义组件;2) 实现图片选择与格式转换;3) 使用`subjectSegmentation.doSegmentation`接口完成主体分割;4) 通过随机RGB值实现背景色动态更换。代码结构清晰,功能完整,适合学习AI图像处理技术。
HarmonyOS NEXT AI基础视觉服务-背景替换
HarmonyOS NEXT AI基础视觉服务-人脸对比
这是一套基于AI基础视觉服务实现的人脸对比系统,用户可通过调用设备相册选择两张图片,系统将提取人脸特征并计算相似度,最终以结构化数据形式展示对比结果(如相似度值和是否为同一人)。代码涵盖模块导入、双图选择、图像处理、人脸对比核心逻辑及UI界面构建,支持异常处理与权限管理,确保功能稳定性和兼容性。适配场景包括身份验证、人脸匹配等,具有较高的实用价值。
HarmonyOS NEXT AI基础视觉服务-人脸对比
阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级
本文介绍了阿里云 AI 搜索开放平台的技术的特点及其在各行业的应用。
HarmonyOS NEXT AI基础视觉服务-人脸识别
这是一个基于AI基础视觉服务的人脸识别案例,通过调用设备相册选择图片,利用MediaLibraryKit、ImageKit和CoreVisionKit等模块完成图像处理与人脸检测,并展示结构化结果。核心功能包括:相册访问授权、图像数据转换、人脸位置及特征点检测,最终以弹窗形式输出检测信息。代码涵盖模块导入、功能实现与UI构建,适合学习AI视觉应用开发流程。
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
本文介绍了通义灵码2.0 AI程序员在嵌入式开发中的实战应用。通过安装VS Code插件并登录阿里云账号,用户可切换至DeepSeek V3模型,利用其强大的代码生成能力。实战案例中,AI程序员根据自然语言描述快速生成了C语言的base64编解码算法,包括源代码、头文件、测试代码和CMake编译脚本。即使在编译错误和需求迭代的情况下,AI程序员也能迅速分析问题并修复代码,最终成功实现功能。作者认为,通义灵码2.0显著提升了开发效率,打破了编程语言限制,是AI编程从辅助工具向工程级协同开发转变的重要标志,值得开发者广泛使用。
8133 69
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
HarmonyOS NEXT AI基础视觉服务-文字识别
本案例展示了一款基于AI基础视觉服务的文字识别应用,通过调用设备相机拍摄照片并识别图片中的文字内容。主要实现步骤包括:1) 导入所需功能模块;2) 调用相机获取图片URI;3) 将图片转换为可识别的像素图;4) 配置视觉识别参数并执行文字识别;5) 构建界面组件,实现拍照与结果显示交互。核心要点涵盖相机权限、图像格式兼容及结构化识别结果处理,完整代码整合了各功能模块的调用流程,确保功能顺畅运行。
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
73 6
如何在Python下实现摄像头|屏幕|AI视觉算法数据的RTMP直播推送
本文详细讲解了在Python环境下使用大牛直播SDK实现RTMP推流的过程。从技术背景到代码实现,涵盖Python生态优势、AI视觉算法应用、RTMP稳定性及跨平台支持等内容。通过丰富功能如音频编码、视频编码、实时预览等,结合实际代码示例,为开发者提供完整指南。同时探讨C接口转换Python时的注意事项,包括数据类型映射、内存管理、回调函数等关键点。最终总结Python在RTMP推流与AI视觉算法结合中的重要性与前景,为行业应用带来便利与革新。
Python下的毫秒级延迟RTSP|RTMP播放器技术探究和AI视觉算法对接
本文深入解析了基于Python实现的RTSP/RTMP播放器,探讨其代码结构、实现原理及优化策略。播放器通过大牛直播SDK提供的接口,支持低延迟播放,适用于实时监控、视频会议和智能分析等场景。文章详细介绍了播放控制、硬件解码、录像与截图功能,并分析了回调机制和UI设计。此外,还讨论了性能优化方法(如硬件加速、异步处理)和功能扩展(如音量调节、多格式支持)。针对AI视觉算法对接,文章提供了YUV/RGB数据处理示例,便于开发者在Python环境下进行算法集成。最终,播放器凭借低延迟、高兼容性和灵活扩展性,为实时交互场景提供了高效解决方案。
113 4

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等