# ApacheCN 校对活动参与手册

简介: # ApacheCN 校对活动参与手册

目的


本文档旨在为一般贡献者提供社区校对活动的参与指南。


本手册充分研究了神经翻译引擎的特点,结合了社区成员的先进经验,使单人可在一周内校对完五本书,而无需逐字阅读。



版本信息


版本 日期 编辑人
v1.0 2022.5.8 飞龙



译后编辑简介


ApacheCN 是立足于自动化的社区,采用了【神经机器翻译】引擎来做中文文档和教程的本地化。


https://docs.apachecn.org/


如你所见,这种方法效率出类拔萃的高,已完成了我们的 70% 的工作量。得益于这种方法,大量技术教程得到翻译,一些技术在中文技术全有了扎根的土壤。


翻译引擎不会改动原文的逻辑,并且在语句通顺程度上可做到 90%。也就是说,一个具有正常读写能力但不懂编程技术的人,在不理解部分专业术语的情况下,可以通读翻译的文章。


然而,翻译引擎由于训练语料的杂乱,领域不单一,对于专业术语往往把握不准,需要译者来把关。由于翻译引擎是个黑盒,无法在翻译过程中提供定制,业界普遍采用【译后编辑】策略。


这种策略被李笑来老师高度赞扬,见《当翻译变成了文本编辑》,他指出在全职状态下,一个熟练的译者一天就能完成一本书。


翻译引擎的错误是结构性的。换句话说,可以通过编辑器的搜索来将其全部发现。一部分甚至可以批量替换来改掉。


在我们的校对活动中,如果你没有时间通读全文,这样也是可以接受的。因为,你不是一个人在战斗,前一个人的疏漏总有后一个人来将其改掉。



校对活动工作流程


在校对活动中,贡献者需要校对三个方面:(1)格式(2)专业术语(3)部分语法。


在每个步骤,经过我们的多次试验,最快方式是通过使用正则表达式来找出译文中的错误。然后把它改正,就是这么简单。


下面列出了所有用到的正则表达式:


格式


链接:

(?<!!)\[[^\]]*\]


表格:

^\|



中文间空格:

中文间空格一般是翻译引擎出错的地方。

[\u4e00-\u9fff]\s+[\u4e00-\u9fff]


未翻译段落:

^[a-zA-Z0-9][^\u4e00-\u9fff]+$
^\s*([\+\-\*]\x20{3}|\d+\.\x20{2})[^\u4e00-\u9fff]+$


内联代码:

Markdown 中,内联代码需要用反引号括起来,但一些教程并没有这样做。于是,需要检查中英文边界,将没有用反引号括起来的内联代码改掉。

[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]\x20*[A-Za-z0-9]|[A-Za-z0-9]\x20*[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]


粗体/斜体:

\*\*[^\*]+\*\*|(?<!\*)\*[^\*]+\*(?!\*)



术语


请见我们收集的术语列表。校对过程中可能还有需要补充的新项目,欢迎补充。

https://github.com/apachecn/home/blob/master/docs/translate/trans-table.md


部分语法


标题:

^#+\x20



列表(二十字以内):


短的列表由于没有上下文非常容易出错。

^\s*([\+\-\*]\x20{3}|\d+\.\x20{2}).{1,20}$
相关文章
|
敏捷开发 存储 搜索推荐
《阿里巴巴Java开发手册v1.4.0(详尽版)》更新,新增16条设计规约
阿里巴巴集团推出的《阿里巴巴Java开发手册》是阿里巴巴近万名开发同学集体智慧的结晶,以开发视角为中心,详细列举如何开发更加高效、更加容错、更加有协作性,力求知其然,更知其不然,结合正反例,让Java开发者能够提升协作效率、提高代码质量。
733450 3
|
5月前
|
人工智能 安全 大数据
【InventWithPython 第一部分】校对活动正式启动
【InventWithPython 第一部分】校对活动正式启动
37 0
新增闯关模式,邀请好朋友测试
计划为精致1010新增闯关模式,先把游戏原型做出来了,希望朋友们可以先行体验,并给予反馈和意见。
95 0
|
消息中间件 NoSQL Java
总结:第一章:从入门到入职拿到过万月薪我需要这些技能(400多篇博文系统归类)P5级
总结:第一章:从入门到入职拿到过万月薪我需要这些技能(400多篇博文系统归类)P5级
110 0
|
消息中间件 tengine 运维
线上问题如何排查处理?这篇全搞定 | 开发者社区精选文章合集(十二)
有哪些常见的线上故障?如何快速定位问题?有哪些排查工具?本合集给你分享线上问题排查技巧!
线上问题如何排查处理?这篇全搞定 | 开发者社区精选文章合集(十二)
|
Java 开发者
我为《Java开发手册》打call 活动战报
活动战报公示!感谢这些同学的积极参与。
1009 0
我为《Java开发手册》打call 活动战报
|
机器学习/深度学习 人工智能 运维
从应届生到测试顶会讲师,他只用了一年时间!
都说憋大招需要时间的积累,一位刚踏出校园入职阿里巴巴淘系技术质量才一年多的新同学,凭什么登上测试行业最高讲台之一的MTSC大会主会场做分享?他是怎么做到的?让我们来看看他的成长故事吧。
657 0
从应届生到测试顶会讲师,他只用了一年时间!
|
SQL 存储 运维
【社区11月份活动预告】线上圆桌讨论:Cassandra数据库与职业发展
主题:Cassandra中文社区首次线上圆桌讨论。本次邀请到阿里云栾小凡、蔚来汽车张旭东以及网龙公司阙乃祯等三位嘉宾。以Cassandra相关的职业发展为主题展开线上圆桌讨论,敬请期待。将在B站、Cassandra中文社区钉钉群等多个渠道开启同步直播。 日期:11月21日(周六) 时间:上午10点-11点
【社区11月份活动预告】线上圆桌讨论:Cassandra数据库与职业发展
|
人工智能 Cloud Native NoSQL
阿里云产品精选内容合集(四)| 具体应用困难?那你不能错过这些应用技巧
本合集精选社区阿里云数据库内容,助你更快更好的了解阿里云数据库近况及实战应用。
|
机器学习/深度学习 NoSQL 大数据
进阶必看丨2017不可错过的十话技术专题(附20+精选专题清单)
云栖社区技术专题模块是阿里云核心技术的主要集合地,在这里,小伙伴们可以浏览各路技术大咖们的精彩技术解读。技术太多总是会令人眼花缭乱,没关系,亲们!社区就是这么替你着想,现在,2017年度专题重磅来袭,让我们一起再重温下大咖们的智慧吧。
12627 0