# ApacheCN 校对活动参与手册

简介: # ApacheCN 校对活动参与手册

目的


本文档旨在为一般贡献者提供社区校对活动的参与指南。


本手册充分研究了神经翻译引擎的特点,结合了社区成员的先进经验,使单人可在一周内校对完五本书,而无需逐字阅读。



版本信息


版本 日期 编辑人
v1.0 2022.5.8 飞龙



译后编辑简介


ApacheCN 是立足于自动化的社区,采用了【神经机器翻译】引擎来做中文文档和教程的本地化。


https://docs.apachecn.org/


如你所见,这种方法效率出类拔萃的高,已完成了我们的 70% 的工作量。得益于这种方法,大量技术教程得到翻译,一些技术在中文技术全有了扎根的土壤。


翻译引擎不会改动原文的逻辑,并且在语句通顺程度上可做到 90%。也就是说,一个具有正常读写能力但不懂编程技术的人,在不理解部分专业术语的情况下,可以通读翻译的文章。


然而,翻译引擎由于训练语料的杂乱,领域不单一,对于专业术语往往把握不准,需要译者来把关。由于翻译引擎是个黑盒,无法在翻译过程中提供定制,业界普遍采用【译后编辑】策略。


这种策略被李笑来老师高度赞扬,见《当翻译变成了文本编辑》,他指出在全职状态下,一个熟练的译者一天就能完成一本书。


翻译引擎的错误是结构性的。换句话说,可以通过编辑器的搜索来将其全部发现。一部分甚至可以批量替换来改掉。


在我们的校对活动中,如果你没有时间通读全文,这样也是可以接受的。因为,你不是一个人在战斗,前一个人的疏漏总有后一个人来将其改掉。



校对活动工作流程


在校对活动中,贡献者需要校对三个方面:(1)格式(2)专业术语(3)部分语法。


在每个步骤,经过我们的多次试验,最快方式是通过使用正则表达式来找出译文中的错误。然后把它改正,就是这么简单。


下面列出了所有用到的正则表达式:


格式


链接:

(?<!!)\[[^\]]*\]


表格:

^\|



中文间空格:

中文间空格一般是翻译引擎出错的地方。

[\u4e00-\u9fff]\s+[\u4e00-\u9fff]


未翻译段落:

^[a-zA-Z0-9][^\u4e00-\u9fff]+$
^\s*([\+\-\*]\x20{3}|\d+\.\x20{2})[^\u4e00-\u9fff]+$


内联代码:

Markdown 中,内联代码需要用反引号括起来,但一些教程并没有这样做。于是,需要检查中英文边界,将没有用反引号括起来的内联代码改掉。

[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]\x20*[A-Za-z0-9]|[A-Za-z0-9]\x20*[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]


粗体/斜体:

\*\*[^\*]+\*\*|(?<!\*)\*[^\*]+\*(?!\*)



术语


请见我们收集的术语列表。校对过程中可能还有需要补充的新项目,欢迎补充。

https://github.com/apachecn/home/blob/master/docs/translate/trans-table.md


部分语法


标题:

^#+\x20



列表(二十字以内):


短的列表由于没有上下文非常容易出错。

^\s*([\+\-\*]\x20{3}|\d+\.\x20{2}).{1,20}$
相关文章
|
4月前
|
缓存 人工智能 程序员
活动|2024 CodeFuse 「编码挑战季」活动已开启!欢迎报名参加
1024程序员节,CodeFuse发起「编码挑战季」活动,邀请开发者参与muAgent、MFTCoder、ModelCache、CodeFuse-IDE四个项目的编码挑战。活动设有多难度任务,完成即可获积分兑换礼品,更有神秘大奖等你来拿!详情及报名请访问CodeFuse官方渠道。
78 1
|
9月前
|
移动开发 小程序 API
社区每周丨my.ap.openURL接口全面开放及上周建议反馈(文含有奖调研)
社区每周丨my.ap.openURL接口全面开放及上周建议反馈(文含有奖调研)
112 0
|
9月前
|
人工智能 安全 大数据
【InventWithPython 第一部分】校对活动正式启动
【InventWithPython 第一部分】校对活动正式启动
52 0
|
人工智能 开发者 黑灰产治理
“用 AI 修复亚运珍贵史料”活动介绍及活动规则【更新获奖名单】
2023年,正值亚运110周年,也是第19届杭州亚运会即将举办之际,阿里云与亚奥理事会合作,发起“历久弥新——用 AI 修复亚运会珍贵史料”活动,开发者使用阿里云的 AI 技术对亚运会历史老照片进行修复,重燃亚运经典,为亚运助威,并有机会入选“亚运史上第一个 AI 修复特展“。
27786 5
“用 AI 修复亚运珍贵史料”活动介绍及活动规则【更新获奖名单】
|
存储
阿里云存储子社区官方征稿活动7月获奖名单
阿里云存储子社区官方征稿活动7月获奖名单来了
294 0
新增闯关模式,邀请好朋友测试
计划为精致1010新增闯关模式,先把游戏原型做出来了,希望朋友们可以先行体验,并给予反馈和意见。
115 0
|
SQL 监控 前端开发
标准回答奉上!软件测试面试的这些话术赶紧拿走
软件测试是一个复杂且重要的技术岗位,因此,大多数互联网企业在面试时,都会严谨对待每一个面试者。 而,作为即将去进行面试测试人来说,想要在面试中,沉着稳定地回答好面试官们提出的问题,前期的软件测试面试话术准备就少不了。
368 0
|
程序员 开发者
《程序员请回答——职场话题篇》视频征集活动来啦,参与即送100元现金!
视频征集活动开启,作品围绕“程序员职场”话题方向,讲述求职面试过程中的技巧、经验和感悟等。本次活动,成功参与投稿的创作者,均可获得100元现金! 更有2000元现金大奖等你拿!
《程序员请回答——职场话题篇》视频征集活动来啦,参与即送100元现金!
|
弹性计算 人工智能 关系型数据库
参与活动后的收获
我使用阿里云的ecs服务器,让自己的每个作品都可以跑上线,特别是一些简单的网页,完成轻松的就部署上来了。非常的好用。未来的展望,希望可以一直玩下去,把自己更多的作品发布上线。也可以在我们的ecs服务器社区分享使用心得,让更多的小白朋友可以更好的加入ecs的大家庭!也期望可以掌握更多的ecs的使用技巧,可以搭建起自己的“知识集群”,为以后工作有更多的机会。 在通过“高校学生在家实践”活动后,我感觉自己提高了自己的专业技能,学会了很多的东西,在遇到自己不会的地方时阿里云的开发者社区给我提供了很好的帮助。渐渐使自己有了独立解决问题的能力,感谢阿里云给了我这次机会。
|
Java 开发者
我为《Java开发手册》打call 活动战报
活动战报公示!感谢这些同学的积极参与。
1027 0
我为《Java开发手册》打call 活动战报

热门文章

最新文章