阿里给所有卖家发福利:全球首个人工智能中文字库免费用

简介:

你打开手机淘宝,精美的海报让你目不转睛,你下了单,从快递员手中接过商品,心满意足的那一刻,你不会想到自己在掏钱买下商品的同时也为海报买了单,从模特、摄影到设计师的后期处理,越精美的海报成本越高,当然,你更想不到的是,海报上的每一个字都是要花钱的……

最近,阿里巴巴悄悄推出了全球首个人工智能中文字库,这款阿里汉仪智能黑体测试版,目前拥有3500个中文汉字,将免费提供给阿里用户使用。

c19d36b2750f1763c39b304ef19fd5b955623438

服务市场下载页面

这既是阿里给电商卖家的春节福利,也是一种新的尝试,阿里希望用技术手段,降低造字成本,让字体市场进入良性发展。而这项技术的受惠者,除了商家、字体公司,当然还包括了消费者。

一套版权费20万的字体

一套正版字体价值不菲。

据悉,天猫上某商家就为一套方正兰亭字体支付了20万元左右的版权费,虽然14款不同字体可以使用5年,但对商家来讲,“要价还是偏高”。

万一有适合广告宣传的收费字体,但前期没有购买版权怎么办?

让设计师对已有的字体进行修改加工,变成新的字体,是一种解决办法。然而一位设计师曾花了半天时间,只设计出6个中文汉字。

“修改设计每个单字不难,把控字体的统一性才是最难的。”该设计师表示,例如“品”“门”“口”这样的字结构过于单一,在修改时反而会增加难度。“有时会发现,组合成的一句话中出现了两种字体,甚至6个字的标题中会出现6种字体,很头疼。”

出于成本考虑,一些商家并不愿意在购买字体版权上花钱,只使用阿里平台上免费商用的华康字体和开源字体。

还有部分商家,则选择使用未经授权的字体,踩中了涉嫌“字体侵权”的雷区。一旦被字体公司起诉,商家除了赔钱,还要撤回已经发布的字体内容,企业的品牌形象和销售业绩都会受到影响。

为什么造字成本这么高

一套字体为何要价万元,字体公司为何四处维权打官司?侵权与维权的背后,不仅仅是利益的撕扯,还有关于创意价值的认可度。

用传统的方法创造一套字体,其实成本很高,因为需要经过创意、选字、确定、拼字、自动分装等一系列漫长的流程。

ffac5a39a808f21079a4f15ac7ff4e72ec701fbc

一套字体通常有两个特点:字型和字量。字型是设计师对字体的“创意”,字库字体讲究整体的搭配协调和美感。

而每套字体的字量通常由市场需求决定。常用的中文简体有6763个中文汉字,包含中文简繁的9169个,用于出版物的大字符集(包含很多生僻字)27533个,包含稀有地名人名用字的超大字符集包含中文7万字以上。

传统字体公司的设计师,可以设计出很独特的单个中文字体,但即便是难度相对低的字型,他们也很难独立完成整套设计。通常是,主创意者创作五六百个字,确定字体的基调后,再由团队其他成员完成剩下的工作。

每一个字都要经过设计师一笔一画地仔细勾勒、调整。通常,设计一套风格字库需要设计1万个左右的字符和标点符号,少则半年、多则好几年才能进入市场。而且,设计出的字体还可能因为不受用户欢迎而宣告失败。

设计成本居高不下,导致正版字体价值不菲,而正版支持者越少,造字成本越高,价格更加降不下来,造字市场就会陷入恶性循环。

怎么用人工智能造字

阿里巴巴每年也要向字体公司支付金额可观的版权费用,就像阿里人机自然交互实验室经常与字体打交道,因为他们的一个研究方向就是设计智能。

“字体相当于设计领域的水电煤。”实验室负责人杨昌源说,“有的字体真的很好看,我们真的很想用,但是太贵了。”

正版字体这么贵,有没有可能让造字成本变低?杨昌源决定带领团队在字体领域做一个新的尝试,用AI生成字体。

“阿里有人才有技术有资源来做这件事情。”杨昌源觉得,造出一款免费字体,对阿里来讲很有价值,既能让商家不再担心版权问题,也能让字体市场变得更加健康。

彼时,实验室正好与阿里PAI团队在其他业务上有所交集,后者主要负责基于阿里云分布式计算引擎的一款机器学习算法平台,“能不能提供技术支持我们做些事?”杨昌源向对方发出了合作邀请。

实验室想要引入新的技术改变现状,PAI团队想要试验新的技术,双方一拍即合,很快达成跨团队合作的意向,他们打算让机器做出一套“跟人做的一模一样的”精美的字体。

此次AI造字,PAI团队的人工智能专家张庆、孙东慧针对字体生成的特定场景将对抗生成网络(GAN)进行了改进。

团队先用天猫字体和淘字体做尝试,但由于两类字体的样本量太少,在手动补充字体样本,用了一两百组算法模型后,设计团队仍认为,字体的精准度不够,还是半成品。

“因为做精准设计的设计师拥有像素级的眼睛,左偏了一个像素都不舒服。” 杨昌源解释道。

两个团队在标准上不能达成一致,AI造字陷入瓶颈。

造一套自带流量的字

调整方向还是就此放弃?杨昌源决定,引入专业的字体公司一起来制定标准。

找字体公司合作并非一帆风顺。“起初谈的时候蛮难的,字体公司的危机感比我们强很多。”杨昌源表示。

很多人惧怕人工智能技术。最初,字体公司担心,自己的生意甚至是整个字体行业会“没了”,更担心阿里这个巨头会不会进入字体这个商业航道。

“字体并不在阿里的主航道上,我们没有野心深度介入字体行业。”杨昌源反复向对方解释,用人工智能造字,是想要尝试将新技术运用到传统的字体领域,“我们不会跟传统行业直接去竞争,我们更多是给大家一个示范,毕竟专业领域的事情还是要靠专业的人去做。”

在合同上来来回回讨论了个把月后,去年12月,汉仪终于与阿里签订了合同,决定双方联手做一套有AI技术成分的字体。双方决定合作的字体是汉仪公司的明星产品,AI造的字体相当于是给这个系列产品做了延伸。

杨昌源说,“签下合同后,我们定下目标:农历年前,一定要出一个版本给大家看,看能到什么程度。

这次合作中,汉仪字库的设计师负责字体的造型设计,阿里的技术团队负责技术,最终通过“喂养”机器,让其自学并生成了一套字库。

bccebc435d5991c31ecdcd711ee5b29fda5a839a

阿里汉仪智能黑体字形设计

在大数据的帮助下,汉仪字库设计部负责人郑乃玉了解到,一套字体设计出约3500字就能覆盖常用的电商广告用语。

让字体设计师们纠结的是,什么样的字体能帮助电商提升销量。他们希望造出一套“自带流量”的字体,郑乃玉说,“例如,商品广告中‘降价了’这样突出的语言最适合使用现在的字体。”

“不能以人为标准去评判AI字体的好坏。”杨昌源表示,评价字体好坏的标准是,生成的字体跟样本字体有90%以上的神似即可,“至少看上去,它像一套字体。”

2018年1月22日,阿里巴巴终于推出了全球首个人工智能中文字库——阿里汉仪智能黑体,并免费提供给阿里用户使用。

正式版将于4月推出

在这套智能字库测试版本发布当天,景德镇胡图网络科技公司的设计师们在第一时间就下载使用了,设计部的胡经理解释,他们的设计师主要做电商设计的排版,自己根本没有时间设计字体,“现在又有新的选择,还是AI生成的,当然要马上试用一下。”

试用后,胡经理也发现了测试版的一些问题,例如螺蛳粉中的“蛳”、聚会中的“聚”字在被放大后会显得棱角不明,像是没有切割完整。另外,阿里这套字体只适用于醒目的大标题,8号、12号大小的字体就不够清晰且略显粗糙。

991213cc599e42ea8d9b467a16193088d8ca7424

胡经理发现测试版中字体的一些问题

汉仪字库设计部负责人郑乃玉表示,AI只能生成字体,并不会自己做调整,人机协作是目前的最佳手段,“横平竖直、棱角分明的汉字还是要靠人工干预。”

杨昌源也坦言,测试版本不完美,还在继续优化。2018年4月,“阿里汉仪智能黑体”将推出正式版本,最终字符集可能是6763,未来将用于服务阿里新零售下千万商家及阿里设计生态。

9648ef9957c98a55782421c61d56dbbb4c2f034a817dfce86465c13a1845e6415bb54ae0bf9e7c5c

字体机器生成过程

人工智能改变字体行业

电商卖家成千上万,消费者喜欢的风格也五花八门,胡经理就发现,女性用户更喜欢秀气的字体,但这套人工智能字库的字体略显粗犷。

对此,杨昌源表示,“阿里在字体领域做尝试是想告诉大家,字体领域是可以有这样一个成果的,进而鼓励大家在有奔头的情况下去做一些尝试。”

“我们想解决的是,当创意很好的时候,怎么加速创意产生到生成的过程。以前设计一套字体需要投入10个人做一年,现在引进新技术,能够节省4-8个月的时间,可以让字体设计人员把注意力更多的放在创意上。” 杨昌源表示。

按照杨昌源的想象,未来,字体行业可能是另一个景象。“字体生态丰富起来,字体的版权也许就不会那么贵了。”

AI造字的过程中,也产生了副产品。“字体检测,我们能够做的很精准了。” 杨昌源透露,现在他们可以检测某字体可能盗用了哪几款正版字体,并提供相应的概率。

在造“阿里汉仪智能黑体”的同时,团队从市面上收集来雍正的毛笔字,临摹出来后给机器学习,机器通过自学仿造出了雍正字体。这项技术无疑将给字体行业、文物及博物馆修复带来一些新的尝试和可能性。

35bef242e07829987cd62c61f2337dfe80bf1ba2

杨昌源开玩笑说,“以后过年,可以让‘雍正赐字’,给电商卖家做些好彩头。”


原文发布时间为:2018-02-23

本文作者:孙茜茜 王安忆

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”微信公众号

相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里通义千问大语言模型在人工智能教育领域的应用探索
阿里通义千问,阿里集团的大型预训练语言模型,应用于AI教育,实现个性化教学、自适应学习系统和智能答疑。通过AIGC,它生成个性化内容,适应不同学生需求,优化教育资源配置,推动教育创新。在教育场景中,模型提供实时反馈,定制学习路径,促进教学质量提升。随着技术进步,AI在教育领域的应用将更加深入,但也需关注伦理与安全。
523 1
|
4月前
|
机器学习/深度学习 人工智能 算法
量化交易与人工智能:Python库的应用与效用
量化交易与人工智能:Python库的应用与效用
263 0
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
跟着阿里训练营视频课程学习人工智能技术遇到的模型网络概念问题
参加人像卡通画训练营视频课程记录的一些概念介绍内容
118 0
|
12月前
|
机器学习/深度学习 人工智能 达摩院
2442 个专业术语!人工智能术语库 AITD 更新至 3.1 版
2442 个专业术语!人工智能术语库 AITD 更新至 3.1 版
358 0
|
机器学习/深度学习 数据采集 人工智能
民谣女神唱流行,基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)
流行天后孙燕姿的音色固然是极好的,但是目前全网都是她的声音复刻,听多了难免会有些审美疲劳,在网络上检索了一圈,还没有发现民谣歌手的音色模型,人就是这样,得不到的永远在骚动,本次我们自己构建训练集,来打造自己的音色模型,让民谣女神来唱流行歌曲,要多带劲就有多带劲。
|
人工智能 并行计算 算法
PyTorch 官方库「上新」,TorchMultimodal 助力多模态人工智能
PyTorch 官方库「上新」,TorchMultimodal 助力多模态人工智能
121 0
|
机器学习/深度学习 人工智能 Kubernetes
人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)
在视频剪辑工作中,假设我们拿到了一段电影或者电视剧素材,如果直接在剪辑的视频中播放可能会遭遇版权问题,大部分情况需要分离其中的人声和背景音乐,随后替换背景音乐进行二次创作,人工智能AI库Spleeter可以帮我们完成大部分素材的人声和背景音乐的分离流程。 Spleeter的模型源来自最大的音乐网站Deezer,底层基于深度学习框架Tensorflow,它可以通过模型识别出素材中的背景音乐素材,从而判断出哪些是背景音乐,哪些是外部人声。
人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)
|
人工智能 并行计算 算法
人工智能,丹青圣手,全平台(原生/Docker)构建Stable-Diffusion-Webui的AI绘画库教程(Python3.10/Pytorch1.13.0)
世间无限丹青手,遇上AI画不成。最近一段时间,可能所有人类画师都得发出一句“既生瑜,何生亮”的感叹,因为AI 绘画通用算法Stable Diffusion已然超神,无需美术基础,也不用经年累月的刻苦练习,只需要一台电脑,人人都可以是丹青圣手。
人工智能,丹青圣手,全平台(原生/Docker)构建Stable-Diffusion-Webui的AI绘画库教程(Python3.10/Pytorch1.13.0)
|
机器学习/深度学习 人工智能 并行计算
闻其声而知雅意,M1 Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)
前文回溯,之前一篇:[含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入)](https://v3u.cn/a_id_260),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转回文字,所谓闻其声而知雅意。
闻其声而知雅意,M1 Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)
|
机器学习/深度学习 存储 人工智能
人工智能不过尔尔,基于Python3深度学习库Keras/TensorFlow打造属于自己的聊天机器人(ChatRobot)
聊天机器人(ChatRobot)的概念我们并不陌生,也许你曾经在百无聊赖之下和Siri打情骂俏过,亦或是闲暇之余与小爱同学谈笑风生,无论如何,我们都得承认,人工智能已经深入了我们的生活。目前市面上提供三方api的机器人不胜枚举:微软小冰、图灵机器人、腾讯闲聊、青云客机器人等等,只要我们想,就随时可以在app端或者web应用上进行接入。但是,这些应用的底层到底如何实现的?在没有网络接入的情况下,我们能不能像美剧[《西部世界》(Westworld)](https://movie.douban.com/subject/2338055/)里面描绘的那样,机器人只需要存储在本地的“心智球”就可以和人类沟
人工智能不过尔尔,基于Python3深度学习库Keras/TensorFlow打造属于自己的聊天机器人(ChatRobot)