暂无个人介绍
视觉AI技术体系及趋势概述
视觉AI技术体系及趋势概述
再见吧云台!AI“魔法”让视频稳定起来
ModelScope DIY 多种场景文字识别
ModelScope DIY 多种场景文字识别
ONE-PEACE: 更好的通用表征模型
达摩院OpenVI-图像MOS评价协助清理“垃圾”照片
新手训练营-引导手册
达摩院OpenVI-目标检测- 针对流感知的长短支路网络 LongShortNet
LLM as Controller—无限拓展LLM的能力边界
LLM as Controller—无限拓展LLM的能力边界
AI顶会论文解读 | 达摩院榜首人脸检测模型MogFace
30分钟,通过ModelScope平台和开源LLM打造个人知识库 QA Bot
30分钟,通过ModelScope平台和开源LLM打造个人知识库 QA Bot
达摩院OpenVI-视频目标跟踪 ProContEXT
【新手上路】趣味AI特训营新手手册~
【新手上路】趣味AI特训营新手手册~
零门槛玩转AI声音定制,3分钟即可复刻你的发音模型
人像卡通化
阿里达摩院联合上海科大、浙大和新科大将知识引入命名实体识别,摘得10个榜首
达摩院联合高德发布业界首个多模态地理文本预训练模型MGeo,并在ModelScope社区开源!
《使用魔搭开发自己的语音AI:从入门到精通》
让机器更懂你--Modelscope情感分析模型
零样本文本分类——低资源场景下文本分类的利器
零样本文本分类——低资源场景下文本分类的利器
WeNet入驻魔搭Modelscope,助推开源语音社区协同创新
[MGeo应用]使用Python+AI模型比较地址相似度
[MGeo应用]使用python+AI模型拆分Excel中地址的省市区街道
使用ModelScope社区搭建OCR应用
使用ModelScope社区搭建表格OCR应用
手把手教你使用ModelScope训练一个文本分类模型
用modelscope分析《天龙八部》,金庸大师最偏爱的是TA
ModelScope开源mPLUG模型带你一键体验大火的视觉问答能力
ModelScope开源mPLUG模型带你一键体验大火的视觉问答能力
视觉问答
大一统模型
人像增强修复
图文检索
智能降噪
风格迁移
语音识别
中文分词
图像识别
表格问答
文本分类
人像抠图
学术界自2000年左右开始对图像生成进行研究。日常采集到的图像数量非常有限,而且采集成本相对较高。因此,我们希望计算机能够自动化生成新的图像。但是,如果图像内容随机生成,无法控制生成结果,则图像依然不可用。
提到目标检测,不得不提到图像分类。 图像分类也是非常基础的工作,它是以一张图片作为输入,输出图片包含的物体类别以及分数。分数指有多大的置信度认为它是某一个类别。 目标检测任务相对于图像任务更进了一步,它会针对一个或者多个目标的图片,检测出其中目标的位置,分辨其类别并给出分数。
NAFNet是一个没有激活函数的神经网络。目前,在图像修复领域有多种类型的网络结构。
关键点检测,也被称作关键点定位或关键点对齐(keypoint alignment),在不同的任务中名字可能略有差异。比如,在人脸关键点定位中会被称作facemark alignment,在人体关键点检测中称作pose alignment。