阿里云视觉智能开放平台上新啦!100+视觉AI算法等你来调~

简介: 13大视觉AI类目,113种算法 有图有真相,先上图,看看咱们大平台上丰富多样的视觉AI算法!         据不完全统计,整个阿里巴巴集团有数千名开发人员围绕着视觉技术在电子商务、城市大脑、金融支付、交通物流、通信会议、新零售、文娱等多个行业的应用需求,不断贡献着各类技术创新与应用实践,形成了多个产品和解决方案。这其中沉淀了诸多视觉基础原子能力,

13大视觉AI类目,113种算法

有图有真相,先上图,看看咱们大平台上丰富多样的视觉AI算法!

        据不完全统计,整个阿里巴巴集团有数千名开发人员围绕着视觉技术在电子商务、城市大脑、金融支付、交通物流、通信会议、新零售、文娱等多个行业的应用需求,不断贡献着各类技术创新与应用实践,形成了多个产品和解决方案。这其中沉淀了诸多视觉基础原子能力,如何将这些算法能力去服务更广泛的用户和开发者群体,发挥更大的价值呢?由阿里巴巴集团技术委员会视觉技术小组和战略合作部牵头,达摩院联合阿里云产品与解决方案管理部以及集团各个视觉技术团队一起创建的阿里云视觉智能开放平台(https://vision.aliyun.com)应运而生,调用量已破千万!

        近期平台新增了30+种AI算法,其中更是包括了针对疫情防控开发的新冠病毒肺炎辅助诊断算法;可在多个场景应用的人脸比对1:N算法、以及针对视频进行处理分析的相关算法服务。

        春节前夕至今的一场肺炎病毒危机席卷了中国乃至整个世界。目前通过肺部ct的检测可迅速判断疑似患者的身体情况,但是由于疑似患者基数较大所以纯靠人工阅片,会耗费医生极大精力。为此我们携手达摩院联合出品 “新冠病毒肺炎辅助诊断”AI算法, 其最大的特点就是又快又准。它可以在20秒内完成一次CT诊断,最短仅2秒,准确率达96%以上!它可以帮助医生快速进行疑似病例诊断,让 AI 在抗击疫情中大显身手,让AI成为医生的助手,让一切变得有可能。

        如果您想要了解此算法的实现原理以及应用到的技术,可点击下方的文章链接查看。《让AI成为医生的助手,达摩院正在让一切变得可能》:https://www.atatech.org/articles/170333

        人脸是计算机视觉技术中应用最为广泛的人体器官。通过创建对应的人脸库,增加人脸数据,然后输入单张人脸图片,调用人脸搜索1:N算法,就会输出与人脸库中的人脸图片进行对比后的结果,人脸比对1:N算法可广泛 应用于企业人脸打卡、安防监控以及闸机刷脸通行等场景,实现刷脸门禁通行,解决忘带工牌、盗刷等问题。

        此外,我们还新增了多个和视频相关的算法。

        前有索尼大法好,后有人像分割大法好,本次上线了视频人像分割AI算法,通过此算法可对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域的mask(掩模)作为视频序列返回。可广泛应用于影视、泛文娱、个人应用等各种场景。例如视频直播过程中你看到的那些花里胡哨的特效,可能就是用到了这个算法,识别用户的人体轮廓,为人像实时增加各种设定的背景特效、贴纸道具,提供更加丰富的娱乐体验。

        不止是人像,我们还对视频里面的标志字幕下了手~通过使用视频标志擦除视频字幕擦除可以快速有效的擦除视频中的台标和字幕,可有效对视频做定向的优化和调整,主要可应用在影视作品当中,例如老电影里面的字幕比较模糊,可以通过此算法去除字幕然后再添加较为清晰的弹幕,以此优化观看者的观看体验。

        为了更好的帮助中小企业和独立开发者快速对接视觉AI算法,阿里云视觉智能开放平台(https://vision.aliyun.com)免费开放平台上现有的100余种视觉AI算法服务的使用权限,除新冠病毒肺炎辅助诊断算法外,其他算法调用不收取任何费用!目前平台整体对外部客户赋能,欢迎外部客户前来咨询调用!

 

相关文章
|
12天前
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
267 0
|
2月前
|
SQL 存储 数据管理
阿里云视觉智能开放平台的逻辑数仓基于统一的SQL语法
【2月更文挑战第9天】阿里云视觉智能开放平台的逻辑数仓基于统一的SQL语法
52 2
|
2月前
|
存储 机器学习/深度学习 人工智能
阿里云视觉智能开放平台确实拥有视频目标检测的能力
【2月更文挑战第9天】阿里云视觉智能开放平台确实拥有视频目标检测的能力
94 7
|
2月前
|
开发者 Python
阿里云视觉智能开放平台中,请问这个如何排查?
【2月更文挑战第9天】阿里云视觉智能开放平台中,请问这个如何排查?
38 6
|
5天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
16 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
1月前
|
存储 人工智能 自然语言处理
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据Gartner报告,到2025 年60%的B2B 销售组织将从基于经验和直觉的销售转变为数据驱动的销售,将销售流程、销售数据、销售分析合并形成一致的运营实践。
394 0
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
|
1月前
|
云安全 人工智能 安全
|
1月前
|
人工智能 UED
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
【2月更文挑战第17天】“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
68 1
“视觉AI任意门”AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
探索无限:Sora与AI视频模型的技术革命 - 开创未来视觉艺术的新篇章
53 1
|
1月前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
18 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键