ModelScope 垂类检测系列模型介绍

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: ModelScope 垂类检测系列模型介绍,该系列模型基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。

ModelScope介绍

ModelScope 是阿里达摩院推出的 中文版模型即服务(MaaS, Model as a Service)共享平台。该平台在2022年的云栖大会上发布,之前也有大量的PR文章进行介绍和推广(如:官方介绍CSDN文章 等),这里就不再赘述。

作为其中的一个贡献者,刚开始接触ModelScope,给我的第一感觉就是,这不就是一个中文版的Hugging Face 吗?但是后来想想,之前的淘宝,QQ,百度等,也是效仿而来,虽然不像ChatGPT, AlphaGo这样的开创性工作一样令人震撼,但至少也是针对国内使用者做了一些改良。当然,我从心底里佩服能够做出ChatGPT, AlphaGo这样工作的人,也希望国内能有一些这样重量级的工作出现。

话说回来,仔细想想,ModelScope相比Hugging Face做了哪些适合“国情”的改良呢?我能够想到的有下面几点:

  • 首先是中文,虽然说对于专业的开发者,查找和阅读英文文档是一个必备的技能,但是有一个中文的平台作为参考和对比,当然也没什么坏处,另外,在AI这个领域,还有还有大量的初级入门者和非专业的开发者,这样的中文平台对他们而言更加友好;
  • 其次是模型种类,Hugging Face本身是从NLP的Transformer“发家”,一些做CV的朋友甚至都不知道它的存在。而ModelScope除了在NLP,在CV, Audio, Multimodal等领域也有不少的模型,没有对NLP明显的侧重;
  • 再者是机器资源,目前处在推广阶段,每位开发者都可以使用阿里云上免费的CPU/GPU机器进行开发,可以从每个模型主页右上角的Notebook选项中进入,是薅羊毛的不二之选;
  • 最后是网络流畅度,相比Hugging Face,ModelScope在网页浏览、模型下载、数据集下载等方面,显然是更加顺畅的。

ModelScope也存在一些明显的不足:

  • 贡献者欠缺,作为一个社区,当然需要更多开发者的贡献,虽然目前也有一些生态伙伴在上面进行模型贡献,但是大部分的模型还是达摩院自研/搬运的模型,如何能够使开源者在github开源的同时也上线到ModelScope,是一个值得考虑的问题;
  • 模型影响力欠缺,作为一个中文的模型即服务平台,ModelScope上还欠缺有影响力的模型,很多国内的优秀工作也没有上线到这里;
  • 代码一致性保障困难,ModelScope是一个“all in one”的仓库,内部和外部的人均能贡献,同一领域的代码风格统一以及模型结构复用等都是很有挑战的。

垂类模型介绍

我们在ModelScope上贡献的垂类模型(垂直领域的热门检测模型)包括:人体部位(人体、人手、人头)和垂类物体(口罩、安全帽、香烟、手机、交通标识等)检测模型,从某种程度上来说,也算是和Hugging Face的一个差异点(Hugging Face 物体检测相关的模型更多是通用的物体检测模型,没有垂类模型)。垂类模型的入口如下图所示:
垂类模型入口
目前,ModelScope上已经有的垂类模型如下表所示,我们也还在逐渐丰富模型中。

序号 模型名称 序号 模型名称
1 实时人体检测模型 6 实时香烟检测模型
2 实时人头检测模型 7 实时手机检测模型
3 实时手部检测模型 8 实时交通标识检测模型
4 实时口罩检测模型 9 Coming soon
5 实时安全帽检测模型

调用方式

1 Demo Service

在每个模型主页的右侧,有demo service的区域,可以上传本地的图片,对模型进行测试,如下图所示:

demo-service

2 Notebook

使用免费的线上机器资源,开启薅羊毛模式,如下图所示。启动对应的实例之后,可以在机器实例中,进行范例代码的运行,也可以搭建自己的服务。
notebook

3 本地使用

如果有本地的机器资源的话,也可以直接pip安装modelscope库,就能够在本地进行使用了。具体可以参考安装教程

* 二次开发

如果需要对现有的模型进行微调(finetune),可以参考每个模型的<微调代码范例>部分,准备好用于微调的数据之后即可对模型进行微调。

总结

垂类检测系列模型是我们在ModelScope上一个初步的尝试,也是针对与Hugging Face差异化做出的一点探索,欢迎大家适用并提出一些建议。我们会继续丰富和完善上面的模型。

相关文章
|
6月前
|
Web App开发 机器学习/深度学习 语音技术
在ModelScope-FunASR中,语音识别系统中的声音活动检测
在ModelScope-FunASR中,语音识别系统中的声音活动检测【4月更文挑战第3天】
266 1
|
6月前
|
自然语言处理
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
144 1
|
6月前
|
API 语音技术
ModelScope-FunASR**有支持热词又支持时间戳的模型**。
【2月更文挑战第30天】ModelScope-FunASR**有支持热词又支持时间戳的模型**。
203 2
|
6月前
|
人工智能 API 决策智能
Modelscope结合α-UMi:基于Modelscope的多模型协作Agent
基于单个开源小模型的工具调用Agent,由于模型容量和预训练能力获取的限制,无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。
|
6月前
|
人工智能 达摩院 自然语言处理
超好用的开源模型平台,ModelScope阿里达摩院
超好用的开源模型平台,ModelScope阿里达摩院
412 1
|
3月前
|
人工智能 开发框架 物联网
赢万元奖金 | 第七届CCF开源创新大赛ModelScope开源模型应用挑战赛开启报名!
第七届CCF开源创新大赛(后简称“大赛”) 由中国计算机学会(CCF)主办,长沙理工大学、CCF开源发展委员会联合承办。
|
6月前
|
人工智能 自然语言处理 搜索推荐
魔搭ModelScope社区作为一个AI模型开源平台,提供了丰富的模型资源和便捷的服务
【2月更文挑战第9天】魔搭ModelScope社区作为一个AI模型开源平台,提供了丰富的模型资源和便捷的服务
432 3
|
5月前
|
人工智能 开发工具 Swift
ModelScope联手OpenDataLab:直接调用7000+开源数据集,赋能AI模型加速研发
魔搭社区和OpenDatalab浦数合作,共同开启一场模型与数据的深度融合,旨在为中国开发者打造更加高效、开放的AI体验。
|
6月前
|
机器学习/深度学习 人工智能 Swift
PAI x ModelScope: 在PAI使用ModelScope模型
在当前的人工智能领域,特别是大语言模型、文生图等领域,基于预训练模型完成机器学习模型的开发部署已成为重要的应用范式,开发者们依赖于这些先进的开源预训练模型,以简化机器学习应用的开发并加速创新。
|
6月前
|
机器学习/深度学习 测试技术 TensorFlow
ModelScope模型使用与EAS部署调用
本文以魔搭数据的模型为例,演示在DSW实例中如何快速调用模型,然后通过Python SDK将模型部署到阿里云PAI EAS服务,并演示使用EAS SDK实现对服务的快速调用,重点针对官方关于EAS模型上线后示例代码无法正常调通部分进行了补充。
220 2