使用ModelScope社区搭建OCR应用
简介: 本文介绍通过ModelScope来完成光学字符识别(OCR)这一应用,该应用使用两个模型: ● 文本检测(ocr_detection) ● 文本识别(ocr_recognition)
VAE+SDE 双视角解读扩散模型原理
扩散模型对于其他生成模型来讲,从数学角度来看更为优美。扩散模型也因为其背后的数学原理让很多人望而却步。今天就来梳理一下常见的两个理解扩散模型数学原理的角度。
【翻译】最近兴起的扩散模型
在这篇文章中,我们将总结一下解决文本到图像生成问题的这一段简短的历史,然后带大家了解一下关于扩散模型的最新进展。为啥要讲扩散模型,因为刚才看到的那些图都是使用扩散模型生成的,扩散模型在是现在最新的SOTA中很重要的一个内容。
【Alink-CsvSourceBatchOp】实现网络广告点击预测,实时训练分类模型,实时预测评估
【Alink-CsvSourceBatchOp】实现网络广告点击预测,实时训练分类模型,实时预测评估
用modelscope分析了百万字的《天龙八部》,原来金庸大师最偏爱的是TA
用modelscope分析了下百万字的《天龙八部》,摸清楚了金庸大师的取名智慧
机器人视觉认知能力将取代人类?ModelScope开源mPLUG模型带你一键体验大火的视觉问答能力
ModelScope上开源了达摩院众多业界最强多模态模型,其中就有首超人类的多模态视觉问答模型mPLUG,小编带大家一起体验下多模态预训练模型的能力。
ModelScope模型库体验之中文StructBERT系列预训练语言模型
StructBERT在BERT的基础上提出改进优化,通过在句子级别和词级别引入两个新的目标函数,打乱句子/词的顺序并使模型对其进行还原的方式,能让机器更好地掌握人类语法,加深对自然语言的理解,使得模型学习到更强的语言结构信息。
AI模型教你写出秒抓读者眼球的好标题
广告大师大卫·奥格威曾在《一个广告人的自白》中提到:标题在大部分广告中,都是最重要的元素,能够决定读者会不会看这则广告。一般来说,读标题的人比读内人的人多出4倍。换句话说,你所写标题的价值将是整个广告预算的80%。因此对于一篇文章、新闻来说,标题的好坏决定了点击和流量。本文介绍通过ModelScope的AI模型PALM来完成标题/摘要生成
ModelScope保姆式教程带你玩转语言生成模型
PALM预训练语言生成模型是针对实际场景中常见的文本生成需求所设计的一个模型。模型利用大量无监督数据,通过结合自编码和自回归任务进行预训练,更贴合下游生成任务所同时需要的理解和生成能力。
四大榜单第一名、首个中文预训练表格模型开源,达摩院TableQA技术让表格说话
在过去两年时间里,阿里达摩院对话智能团队(Conversational AI)围绕 TableQA 做了一系列探索,先后在四大国际权威榜单上取得第一名,并且开源了首个中文预训练表格模型。同时,把 TableQA 技术落地为产品,在阿里云智能客服中开始规模化推广,成为具备差异化竞争力的新产品。本文将对达摩院在 TableQA 技术方向的系列探索创新和业务落地做系统的梳理介绍。
如何向大模型注入知识?达摩院通义对话模型SPACE系列探索
如何将人类先验知识低成本融入到预训练模型中一直是个难题。达摩院对话智能团队提出了一种基于半监督预训练的新训练方式,将对话领域的少量有标数据和海量无标数据一起进行预训练,从而把标注数据中蕴含的知识注入到预训练模型中去,打造了SPACE 1/2/3 系列模型,在11个国际公开对话数据集取得SOTA。
如何通过分割模型完成证件照制作
语义分割或者抠图完之后,我们会获取一个带有alpha通道的png图像。可以通过该图像进一步加工,更换前景的背景图片,从而实现证件照制作、换背景、换天等的玩法。本文主要介绍如何对alpha通道进行原图加工,从而实现证件照功能。