追番神器+1!即时翻译、瞬间排版,这个基于漫画的AI系统居然想消灭汉化组?

本文涉及的产品
文档翻译,文档翻译 1千页
车辆物流识别,车辆物流识别 200次/月
教育场景识别,教育场景识别 200次/月
简介: 追番神器+1!即时翻译、瞬间排版,这个基于漫画的AI系统居然想消灭汉化组?

看番,周更太慢!

想看原版漫画,不会日语,愁死个人!

虽然现在在各大社交媒体上都有民翻,但是想看的漫画偏偏太过小众,没人翻译!

别急别急,救星来了。

去年,一位叫作石渡祥之佑的小哥开发了一个AI系统Mantra,该系统结合了特定于漫画的图像识别技术、机器翻译和外语排版自动化技术,也就是说,能够直接在漫画原文上实现翻译。

要知道,在日本,漫画的出版占到了整体出版物的40%,人工翻译费用更是高达每本200,000到300,000日元。

这项AI技术不仅提升了漫画翻译的速度,翻译的成本也降低了60-70%。

说到这,文摘菌想到AI也曾帮助中国爽文成功出海,看来AI对文化产业仍然有十分重要的贡献。

这个项目在开发初期就接受到了来自东京大学FoundX计划、IPA、东大IPC计划的支持。最近,DEEPCORE、DMM VENTURES、Legend Co、天使投资等更是对其投资8000万日元。

看得出来,大家对漫画出海抱有十分强烈的信心和希望。

而且敲黑板划重点,Mantra服务预计将在7月正式对外开放,本年度的精神支柱就靠它了。

剑指海外发行,Mantra实现的不只是简单的文本翻译

Mantra主要实现了两项功能,首先是机器翻译,在这方面,研究人员对Mantra进行了特定于漫画的技术处理,在这个基础上,Mantra能够实现多语言无障碍翻译。

针对漫画的机器翻译技术到底是怎么回事,石渡小哥介绍道,简单来说,Mantra就是把传统的手动翻译自动化了。

人为翻译漫画主要有以下三个步骤:
对文本转录;
填充语言气泡的文本部分并进行翻译;
把翻译好了的文本进行正确地排版。

看得出来,漫画的机器翻译就不只是语言的转换,还包括了翻译后的排版工作。

要实现这两项功能,首先要准确定位到语言气泡,然后再对其中的文本进行识别与翻译。

听起来容易,但是要知道,漫画中的气泡文本排版没有能够总结的规律,还存在字体大小和样式的差异,这些都将使得漫画的机器翻译比传统商业翻译更为困难。

要解决这个难题,石渡小哥开发了专用于漫画字符识别的OCR引擎,在OCR引擎的助力下,系统可以准确地检测和识别气泡中的文本,即使漫画图像十分拥挤也不在话下。

左边是日语原版,右边是Mantra的机器翻译版本,可以看到翻译和排版的精度都相当高

不过总的来说,翻译的难度要大于识别难度,因为漫画里面经常出现口吃或者中途断句等口语行为,还要处理好文字和表情的关系。

目前,团队也正在针对漫画表情开发识别引擎。

要完全实现漫画翻译想必也十分耗时耗财,也正是因为如此,团队的目标首先就是降低人工翻译的花费,目前的翻译仍然需要人工修正,为了更好地进行编辑,团队也正在开发一种新工具更好地将机器翻译和人工翻译结合起来。

对于Mantra的潜在发展目标,石渡小哥表示,希望能将该技术利用到出版行业,拓展漫画的海外市场,以及将其用于个人使用,有助于漫画作者在社交媒体上自由地发布作品。

要打造一个漫画文字瞬间走向世界的未来

石渡小哥介绍道,其实Mantra的开发也是纯属偶然。

在博士阶段,他曾向ACL大会提交了一篇机器翻译的论文,当时他的一位同期日亚正在攻读图像识别领域的博士学位,他也曾向相关领域的顶会投了一些论文。

于是在他博三的暑假,他们两人一拍即合,决定一起做个副业,用机器翻译一本漫画书,这也是他们做了一些用户访谈之后定下来的方向。

“如果能好好利用机器翻译漫画相关技术,也许就能打造一个让文字漫画在瞬间走向世界的未来。”

后来,我们对这个项目越来越上心,博士毕业之后,决定以创业的方式进行正式的研究。

在Mantra的开发过程中,他们也遇到了不少困难,比如,石渡小哥就分享道,首先在训练数据上就是缺失的,当时并没有基于双语的漫画数据。

本着万事开头难的信念,他们决定抽选很少一部分已经被翻译成外语的漫画作品,从中提取出双语文本数据,这样就以很低的成本创建了首个漫画翻译领域的双语数据库。

如今,在漫画翻译上,还存在很多问题有待解决,比如有时候人物对话会突然被打断,中间出现一个文本气泡,以及在漫画对话中经常会省略主语和宾语。

最近,他们也正在针对这些问题进行逐一攻克,目前的译文准确率还不是很高,在完全没有人为修正的情况下,能勉强读懂30%的内容,他们的目标是实现70%-80%的可读性。

Mantra的目标是确保所有的漫画作品都能即时传送到全世界粉丝手上,如果一位日本漫画家的作品发布在了平台上,就会被瞬间翻译成5-10种不同的语言,这样的平台能够实现,相信也能从技术上消灭盗版。

为了让更多的人能够使用,他们也正计划把平台支持的语言扩展到目前的英文和中文之外。

汉化不能少!B站手把手教你安装,追剧不停

不要以为翻译只有输出国的技术人员在着急,输入国的粉丝简直眼睛都要望穿了,这其中,中国肯定要占上一席。

于是,汉化组们可能要哭了,因为B站上有一个UP主开源了一款OCR翻译软件。

根据介绍,当在屏幕上设定好翻译框后,出现在框中的外语都会被自动识别并快速翻译成中文,不仅支持漫画,还支持游戏、番剧、PDF文献等。

在GitHub上,官方人员总结了这款翻译软件的六大优缺点:
适用范围全面,几乎所有出现在屏幕的东西都可以翻译;
翻译接口多,目前有12个翻译接口;
简洁美观的界面;
及其简单傻瓜的操作方式;
相比较其他OCR翻译器配置有自动翻译模式;
需要联网,可能视网速不同翻译速度有差。

GitHub链接:
https://github.com/PantsuDango/Dango-Translator

不过总的来说,还是很香的,网友们也纷纷表示,太香了太香了,简直比YouTube还香!

在使用上,有人表示,虽然需要付费,但是免费额度已经足够打游戏用了。不过看到这么香的翻译软件真的能控制住想要打钱的冲动吗?

在B站上,开发人员也上传了视频对如何安装进行了手把手的教学:

视频链接:
https://www.bilibili.com/video/BV1gp4y1Q7Ts

正好,端午到了,出得去的出不去的,都浪起来!

相关报道:
https://ainow.ai/2019/12/09/181620/
https://ainow.ai/2020/06/08/223964/

相关文章
|
14天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
70 9
|
1月前
|
机器学习/深度学习 数据采集 人工智能
未来的守护神:AI驱动的网络安全之盾,如何用智慧的光芒驱散网络黑暗势力?揭秘高科技防御系统背后的惊天秘密!
【10月更文挑战第3天】随着网络技术的发展,网络安全问题日益严峻,传统防御手段已显不足。本文探讨了构建AI驱动的自适应网络安全防御系统的必要性及其关键环节:数据采集、行为分析、威胁识别、响应决策和执行。通过Python库(如scapy、scikit-learn和TensorFlow)的应用实例,展示了如何利用AI技术提升网络安全防护水平。这种系统能够实时监控、智能分析并自动化响应,显著提高防护效率与准确性,为数字世界提供更强大的安全保障。
60 2
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI系统】AI在不同领域的应用与行业影响
本文探讨了人工智能在计算机视觉、自然语言处理及音频处理等领域的广泛应用,并展示了其在自动驾驶、安全监控、搜索引擎优化、客户服务、语音识别及多个行业的革新作用,强调了AI基础设施与系统创新对未来社会的影响与价值。
90 1
|
25天前
|
人工智能 自然语言处理 机器人
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
10 月 18 日, InfoQ《C 位面对面》栏目邀请到阿里云 CIO 及 aliyun.com 负责人蒋林泉(花名:雁杨),就 AI 时代企业 CIO 的角色转变、企业智能化转型路径、AI 落地实践与人才培养等主题展开了讨论。
766 67
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
|
24天前
|
存储 人工智能 自然语言处理
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
|
13天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗领域的革命:智能诊断系统的未来
在科技日新月异的今天,人工智能(AI)技术正逐渐渗透到我们生活的每一个角落,其中医疗领域尤为显著。本文将探讨AI在医疗诊断中的应用及其带来的变革,重点介绍智能诊断系统的发展现状与未来趋势。通过深入浅出的方式,我们将揭示AI如何改变传统医疗模式,提高诊断效率和准确性,最终造福广大患者。
|
19天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
129 6
|
12天前
|
人工智能 自然语言处理 安全
AI技术在智能客服系统中的应用与挑战
【10月更文挑战第28天】本文将深入探讨人工智能(AI)技术在智能客服系统中的应用及其面临的挑战。我们将通过实例分析,了解AI如何改善客户服务体验,提高效率和降低成本。同时,我们也将关注AI在实际应用中可能遇到的问题,如语义理解、情感识别和数据安全等,并提出相应的解决方案。
|
1月前
|
人工智能 安全 自动驾驶
【通义】AI视界|英特尔和AMD“史无前例”首次合作,组建X86生态系统咨询小组
本文概览了近期科技领域的五大热点新闻,包括联想与Meta合作推出个人AI智能体“AI Now”,英特尔和AMD首次合作组建X86生态系统咨询小组,特斯拉计划大规模生产自动驾驶出租车,前Palantir首席信息安全官加盟OpenAI,以及Meta因涉嫌损害青少年心理健康面临美国多州诉讼。更多资讯,请访问通义平台。
|
1月前
|
数据采集 人工智能 测试技术
还在死磕AI咒语?北大-百川搞了个自动提示工程系统PAS
【10月更文挑战第4天】北京大学和百川智能研究人员开发了一种名为PAS的即插即用自动提示工程(APE)系统,利用高质量数据集训练的大型语言模型(LLMs),在基准测试中取得了显著成果,平均提升了6.09个百分点。PAS仅需9000个数据点即可实现顶尖性能,并能自主生成提示增强数据,提高了灵活性和效率。尽管存在训练数据质量和提示多样性等方面的潜在局限性,PAS仍为解决提示工程挑战提供了有前景的方法,有望提升LLM的可用性和有效性。论文详见:https://arxiv.org/abs/2407.06027。
41 3

热门文章

最新文章