EasyPhoto+PAI-DSW体验世界名画AIGC写真创作
EasyPhoto 是一个Webui UI插件,用于生成AI肖像画。基于StableDiffusion + 人物定制Lora + ControlNet 的方式实现,支持低代码操作、自定义风格,让更多开发者可以灵活地开发自己的风格化的艺术照生成。本教程基于阿里云人工智能PAI产品快速启动EasyPhoto,实现低代码开发个性化AI真人写真。收到
3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!
各类AI写真软件由于其精准的个人形象+精美的生成效果引爆了朋友圈传播,证件照满足了用户刚需,古装照等风格照满足了用户“美照”的需求。 达摩院开放视觉团队推出了开源版本,希望结合开源社区开发者的力量,可以让图片应用更有趣、更好玩、也有更多应用场景。
三分钟视频教你一键修复老照片 找回曾经的美好记忆
【场景应用】可以应用于老照片、手机图片、老视频等素材的修复。【数据集链接】数据集:https://www.modelscope.cn/datasets/baiguan18/image-portrait-enhancement-dataset/summary模型文件:https://www.modelscope.cn/models/damo/cv_gpen_image-portrait-enhancement/summary
一秒变身!一键生成N次元虚拟卡通形象!
【场景应用】头像/通用图片的卡通化特效生成,广泛用于智能AI创作、社交娱乐、人物隐私保护等场景【数据集链接】数据集:https://modelscope.cn/datasets/modelscope/human_face_portrait_compound_dataset/summary模型文件:https://modelscope.cn/models/damo/cv_unet_person-image-cartoon_compound-models/files
达摩院OpenVI开源Talk No.3:Modelscope 视觉检测&关键点系列模型与应用介绍
本期视频分为4个部分展开,主要介绍了Modelscope—CV模型概览、视觉检测系列模型与应用、视觉关键点系列模型与应用、未来计划&展望。
支付宝率先接入!魔搭社区上线「MCP广场」与1400款MCP服务
4月15日,中国第一AI开源社区魔搭(ModelScope)推出全新MCP广场,上架千余款热门的MCP服务,包括支付宝、MiniMax等全新MCP服务在魔搭独家首发。魔搭社区为AI开发者提供丰富的MCP服务及调试工具,并支持第三方平台集成和调用,通过开源开放的方式加速Agent及AI应用的创新和落地。
达摩院OpenVI开源Talk No.2:Modelscope底层视觉模型与应用
本视频分享了GAN、扩散模型、Transformer模型,适用于图像超分辨率、图像上色、图像补全、图像修复等API能力上。
视频生成模型 VideoComposer
VideoComposer是由阿里巴巴研发的可控视频生成框架,其可以让用户更灵活地使用文本条件、空间条件和时序条件来生成视频,比如使用草图、深度图或运动向量等多个组合条件合成目标视频,极大地提高了视频灵活性和可控性。本项目相比于之前的开源项目主要增加了无水印数据训练,可使得生成的视频没有水印。此外,本项目目前只支持文本+深度图+Style方便体验。
pg4ml 机器学习框架系列课程:实现细节、XOR 模型案例(上)
pg4ml 机器学习框架是基于 PostgreSQL v13 实现的、使用 plpgsql 编写的机器学习框架,本次讲解的实验环境基于PolarDB-PG开源数据库。本次分享主要介绍框架的实现细节,并构建XOR两层网络的模型案例,包括数据集、XOR分类的案例与原理、神经网络节点、训练任务结构与执行等内容。
2022世界人工智能大会——大规模预训练模型主题论坛
大规模预训练模型展示了一种通用的人工智能方式。而令大模型真正成为下一代人工智能的基础建设,离不开“算法、算力、数据”的突破;也离不开产学研届共同以更加开放的姿态创造共享、互惠的新生态。 本次“大规模预训练模型”主题论坛由阿里巴巴集团主办,将围绕“大规模预训练模型的创新、落地和开源开 放”展开,将探讨的边界延伸至算法模型、大数据及训练框架等方向,同时展示国内大国的创新技术成果。 讲师/嘉宾简介 上海市副秘书长—庄木弟 阿里巴巴资深副总裁/达摩院副院长/IEEE Fellow—周靖人 澜舟科技创始人兼CEO/中国计算机学会副理事长/创新工场首席科学家—周明 深势科技创始人 & 首席科学家—张林峰 清华大学计算机系副主任—唐杰 IDEA研究院讲席科学家—张家兴 达摩院研究员—黄非 复旦大学计算机学院教授—邱锡鹏 阿里云智能研究员—林伟 达摩院资深算法专家—杨红霞 IDEA研究院讲席科学家—张家兴 达摩院资深算法专家—黄松芳 澜舟科技首席产品官—李京梅
人体描边大师5分钟提高班
人体关键点检测数据集:https://www.modelscope.cn/datasets/modelscope/body_2d_keypoints_test_dataset/files模型文件:https://www.modelscope.cn/models/damo/cv_hrnetv2w32_body-2d-keypoints_image/files/pytorch_model.pt
机器打工人头件事先听懂再说话
语音识别简介模型文件:https://www.modelscope.cn/models/damo/speech_paraformer_asr_nat-zh-cn-16k-common-vocab8358-tensorflow1/files
告别PS,一键抠图不是梦
【场景应用】方便设计师抠图,不需要使用photoshop等工具,实现一键全自动抠图;可以帮助用户换背景,实现多样化玩法。 【数据集链接】数据集:https://modelscope.cn/datasets/liujl09/Human_matting_testing_dataset/summary模型文件:https://modelscope.cn/models/damo/cv_unet_image-matting/files
万物识别:教你一行代码通识万物
通用模型介绍模型文件https://modelscope.cn/models/damo/cv_resnest101_general_recognition/files
阿里研究院@从理论到应用:论道认知智能丨CCF C³活动 基于超大规模预训练模型的小样本和零样本学习
9月24日,CCF C³活动来到阿里研究院,齐聚来自各行业的企业CTO、高级技术人才和资深学者,共同探讨企业人工智能从感知智能向认知智能阶段发展的意义。 活动开始前,与会嘉宾参观了阿里巴巴集团北京展区,现场活动由CCF副秘书长、亿邦动力CEO王超主持。CCF副理事长、创新工场首席科学家、澜舟科技创始人周明做了开场致辞,并代表CCF为活动承办方阿里研究院颁发CCF C³活动承办单位感谢牌。 周明表示,CCF C³活动,希望加强企业界和企业界之间、企业界和学术界之间的沟通交流,让不同文化相互碰撞,互相取长补短。阿里研究院副院长安筱鹏在开场致辞中说,阿里巴巴既是商业的阿里,也是科技的阿里,致力于由商业和技术双轮驱动,成为的全球数字科技领先的公司。 苏中在主题报告中介绍了阿里在大模型技术领域的尝试。苏中指出,人的优势是可以举一反三,进行小样本,甚至零样本的学习;而机器要拥有这样的认知能力,就要通过海量数据来进行预训练。当模型的规模不断扩大,出现百亿、万亿参数规模的大模型技术,通过算力和海量数据,给计算机提升认知智能能力“打开了窗户”。
达摩院对话大模型SPACE助你搞定任务对话
【预训练对话简介】数据集:https://www.modelscope.cn/datasets/modelscope/MultiWoz2.0/summaryhttps://www.modelscope.cn/datasets/modelscope/banking77/summary模型文件:https://www.modelscope.cn/models/damo/nlp_space_dialog-intent-prediction/files
大一统模型在这里?快来看OFA如何一个模型搞定各类任务
【参考资料】大一统模型简介数据集:https://modelscope.cn/datasets/modelscope/coco_2014_caption/fileshttps://modelscope.cn/models?name=ofa&page=1%20caption模型文件:https://modelscope.cn/models/damo/ofa_image-caption_coco_large_en/summary
用Modelscope!一网打尽各种文本分类模型
文本分类模型介绍数据集:https://www.modelscope.cn/datasets/DAMO_NLP/BQ_Corpus/summaryhttps://www.modelscope.cn/datasets/DAMO_NLP/ChineseSTS/summaryhttps://www.modelscope.cn/datasets/DAMO_NLP/LCQMC/summary模型文件:https://modelscope.cn/models/damo/nlp_structbert_sentence-similarity_chinese-base/files
教你3分钟视频变动漫
视频变动漫简介数据集:https://modelscope.cn/datasets/modelscope/human_face_portrait_compound_dataset/summary模型文件:https://modelscope.cn/models/damo/cv_unet_person-image-cartoon_compound-models/files
达摩院大模型技术交流会
阿里巴巴达摩院前沿自然语言处理预训练模型体系——AliceMind系统化揭秘,全方位了解其背景介绍、算法能力、工作成果、工程实践及业务落地应用。1.达摩院AliceMind算法团队专家亮相直播,带你深入走近VQA Challenge首超人类的大规模多模态预训练技术——AliceMind-MMU,了解其背后的技术工作及基于电商场景的落地案例;解读与阿里云计算平台PAI团队合作的最新成功——基于稀疏的大规模语言模型落地方案的的前沿进展和最佳实践。2.达摩院高级技术专家带你走进大模型落地的背后,从工程侧详细探讨超大规模语言模型落地过程中的体系建设。3.达摩院AliceMind团队 x 阿里云计算平台事业部合作业务落地结果首次发布,看基于预训练模型的QA生成算法如何在大数据场景的落地。讲师/嘉宾简介出品人:黄松芳 博士 达摩院 资深算法专家,深度语言模型体系AliceMind团队负责人。负责超大规模多模态预训练模型的技术研发和行业应用。英国爱丁堡大学博士,加入阿里巴巴之前,曾在IBM研究院工作10多年。嘉宾:徐海洋 达摩院 专家算法工程师个人简介:主要负责大规模多模态预训练工作,毕业于东南大学,曾就职滴滴AI LABS,在国际顶级会议ACL,EMNLP,IJCAI,SIGIR,InterSpeech等发表论文10多篇,参与开源项目AliceMind,DELTA。谭传奇 达摩院 算法专家个人简介:北航-MSRA联合培养博士生,2019年毕业后加入阿里巴巴达摩院,先后参与医疗NLP和语言模型方向研究,研究方向有信息抽取、阅读理解、语言模型等,目前负责阿里巴巴深度语言模型体系AliceMind中大规模语言模型(PLUG)的落地工作。曾在MS-MARCO、TREC PM、TREC CT等国际权威评测获得冠军,在ICLR、NeurIPS、ACL、EMNLP、NAACL、AAAI、IJCAI、WWW等国际会议发表论文20余篇。张志成 达摩院 高级技术专家个人简介:张志成,阿里巴巴达摩院机器智能高级技术专家,普渡大学硕士,专注人工智能领域的算法与工程落地,曾负责大型智能建筑项目中的能源优化决策系统的算法设计和平台系统研发,负责图像识别和视频追踪在图片与视频广告投放中的算法训练和相关系统设计,目前在达摩院负责nlp语言模型平台的建设和维护。管正雄 阿里云 高级算法工程师个人简介:专注于AIOps领域的算法研究与落地,感兴趣的算法方向有:时序异常检测、根因定位、NLP相关等。目前在阿里云计算平台大数据基础工程技术团队,以AIOps算法侧的角色为业务团队带来增益。
pg4ml 机器学习框架系列课程:实现细节、XOR 模型案例(下)
pg4ml 机器学习框架是基于 PostgreSQL v13 实现的、使用 plpgsql 编写的机器学习框架,本次讲解的实验环境基于PolarDB-PG开源数据库。本次分享主要介绍框架的实现细节,并构建XOR两层网络的模型案例,包括计算图和链式求导设计、训练任务的结构与准备、执行、监控、测试验证等内容。
达摩院表格—理解大模型STAR,带你玩转表格问答
表格问答模型介绍数据集:https://modelscope.cn/datasets/yuchen/CoSQL/summary模型文件:https://modelscope.cn/models/damo/nlp_star_conversational-text-to-sql/summary
喂,能听清吗?别问了,我有智能降噪!
智能降噪简介数据集:https://modelscope.cn/datasets/modelscope/ICASSP_2021_DNS_Challenge/summary"模型文件:https://modelscope.cn/models/damo/speech_frcrn_ans_cirm_16k/files
中文CLIP上线啦!8行代码助你快速上手图文检索
图文检索简介模型文件:https://www.modelscope.cn/models/damo/multi-modal_clip-vit-base-patch16_zh/summary
多模态问答模型带你实现高阶人机交流
【场景应用】能够和机器自动进行各种类型的多模态问答,可以应用到各种人机交互的场景【数据集链接】数据集:https://modelscope.cn/datasets/modelscope/vqa_trial/summary模型文件:https://modelscope.cn/models/damo/mplug_visual-question-answering_coco_large_en/files