# ApacheCN 校对活动参与手册

简介: # ApacheCN 校对活动参与手册

目的


本文档旨在为一般贡献者提供社区校对活动的参与指南。


本手册充分研究了神经翻译引擎的特点,结合了社区成员的先进经验,使单人可在一周内校对完五本书,而无需逐字阅读。



版本信息


版本 日期 编辑人
v1.0 2022.5.8 飞龙



译后编辑简介


ApacheCN 是立足于自动化的社区,采用了【神经机器翻译】引擎来做中文文档和教程的本地化。


https://docs.apachecn.org/


如你所见,这种方法效率出类拔萃的高,已完成了我们的 70% 的工作量。得益于这种方法,大量技术教程得到翻译,一些技术在中文技术全有了扎根的土壤。


翻译引擎不会改动原文的逻辑,并且在语句通顺程度上可做到 90%。也就是说,一个具有正常读写能力但不懂编程技术的人,在不理解部分专业术语的情况下,可以通读翻译的文章。


然而,翻译引擎由于训练语料的杂乱,领域不单一,对于专业术语往往把握不准,需要译者来把关。由于翻译引擎是个黑盒,无法在翻译过程中提供定制,业界普遍采用【译后编辑】策略。


这种策略被李笑来老师高度赞扬,见《当翻译变成了文本编辑》,他指出在全职状态下,一个熟练的译者一天就能完成一本书。


翻译引擎的错误是结构性的。换句话说,可以通过编辑器的搜索来将其全部发现。一部分甚至可以批量替换来改掉。


在我们的校对活动中,如果你没有时间通读全文,这样也是可以接受的。因为,你不是一个人在战斗,前一个人的疏漏总有后一个人来将其改掉。



校对活动工作流程


在校对活动中,贡献者需要校对三个方面:(1)格式(2)专业术语(3)部分语法。


在每个步骤,经过我们的多次试验,最快方式是通过使用正则表达式来找出译文中的错误。然后把它改正,就是这么简单。


下面列出了所有用到的正则表达式:


格式


链接:

(?<!!)\[[^\]]*\]


表格:

^\|



中文间空格:

中文间空格一般是翻译引擎出错的地方。

[\u4e00-\u9fff]\s+[\u4e00-\u9fff]


未翻译段落:

^[a-zA-Z0-9][^\u4e00-\u9fff]+$
^\s*([\+\-\*]\x20{3}|\d+\.\x20{2})[^\u4e00-\u9fff]+$


内联代码:

Markdown 中,内联代码需要用反引号括起来,但一些教程并没有这样做。于是,需要检查中英文边界,将没有用反引号括起来的内联代码改掉。

[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]\x20*[A-Za-z0-9]|[A-Za-z0-9]\x20*[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]


粗体/斜体:

\*\*[^\*]+\*\*|(?<!\*)\*[^\*]+\*(?!\*)



术语


请见我们收集的术语列表。校对过程中可能还有需要补充的新项目,欢迎补充。

https://github.com/apachecn/home/blob/master/docs/translate/trans-table.md


部分语法


标题:

^#+\x20



列表(二十字以内):


短的列表由于没有上下文非常容易出错。

^\s*([\+\-\*]\x20{3}|\d+\.\x20{2}).{1,20}$
相关文章
|
机器学习/深度学习 存储 算法
sklearn应用线性回归算法
sklearn应用线性回归算法
|
分布式计算 大数据 数据处理
浅谈几个经典大数据处理框架
【6月更文挑战第15天】本文介绍企业如何在数据洪流中保持竞争力需借助可扩展平台和数据策略。数据管道整合多元数据源,便于分析和流转。Kappa架构专注于实时处理(如通过Kafka、Spark Streaming),适合实时响应场景;Lambda架构结合批处理与实时处理(如Spark、Hadoop与Flink),平衡实时性和批处理,易于开发和维护。Apache Beam提供统一模型,适用于流处理和批处理,提升代码复用和效率。这两种架构满足现代应用对数据一致、性能和灵活性的需求。
1287 3
浅谈几个经典大数据处理框架
|
缓存 安全 数据安全/隐私保护
如何根据请求场景选择 GET 或 POST 请求方法?
【10月更文挑战第27天】根据不同的请求场景,综合考虑数据传输目的、安全性、数据量大小、幂等性要求以及缓存需求等因素,合理地选择GET或POST请求方法,能够更好地实现客户端与服务器之间的数据交互,提高系统的性能和安全性。
517 64
|
前端开发 安全 Java
使用Java Web框架:Spring MVC的全面指南
【4月更文挑战第3天】Spring MVC是Spring框架的一部分,用于构建高效、模块化的Web应用。它基于MVC模式,支持多种视图技术。核心概念包括DispatcherServlet(前端控制器)、HandlerMapping(请求映射)、Controller(处理请求)、ViewResolver(视图解析)和ModelAndView(模型和视图容器)。开发流程涉及配置DispatcherServlet、定义Controller、创建View、处理数据、绑定模型和异常处理。
593 1
使用Java Web框架:Spring MVC的全面指南
|
设计模式 存储 C++
《C++设计模式:重塑游戏角色系统类结构的秘籍》
在游戏开发中,游戏角色系统的类结构设计至关重要。通过C++设计模式,如单例模式、工厂模式、策略模式、装饰器模式、观察者模式和组合模式,可以有效管理角色的创建、属性、行为及状态更新,提高系统的扩展性、可维护性和可读性,从而为玩家带来更优质的游戏体验。
294 4
|
传感器 物联网 开发工具
STM32:微控制器技术探索与实践
STM32:微控制器技术探索与实践
386 5
|
数据采集 算法 搜索推荐
数据挖掘实战:基于KMeans算法对超市客户进行聚类分群
数据挖掘实战:基于KMeans算法对超市客户进行聚类分群
3317 0
|
存储 小程序 Java
基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖微信小程序端(九)
基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖微信小程序端(九)
|
Linux Shell Perl
Linux环境下的字符串处理:基础到高级
在Linux系统中,字符串处理是一个非常常见的任务,无论是在系统管理、文本处理还是脚本编程中。本文将从基础的字符串操作开始,逐步深入,介绍Linux下的字符串处理技术,包括基础的命令行操作、常见的文本处理工具、Shell脚本中的字符串操作等。
558 1