《Java编码指南:编写安全可靠程序的75条建议》—— 指南6:正确地编码或转义输出

简介: 适当的输入检查可以防止恶意数据插入数据库等子系统。虽然不同的子系统需要不同类型的数据无害化处理,但是子系统最终要接收的输入形式都很明确,因此可以很清楚地知道需要什么样的数据无害化处理。

本节书摘来异步社区《Java编码指南:编写安全可靠程序的75条建议》一书中的第1章,第1.6节,作者:【美】Fred Long(弗雷德•朗), Dhruv Mohindra(德鲁•莫欣达), Robert C.Seacord(罗伯特 C.西科德), Dean F.Sutherland(迪恩 F.萨瑟兰), David Svoboda(大卫•斯沃博达),更多章节内容可以访问云栖社区“异步社区”公众号查看。

指南6:正确地编码或转义输出

适当的输入检查可以防止恶意数据插入数据库等子系统。虽然不同的子系统需要不同类型的数据无害化处理,但是子系统最终要接收的输入形式都很明确,因此可以很清楚地知道需要什么样的数据无害化处理。

有几个用于输出数据的子系统。HTML渲染器是一种常见的用于显示程序输出的子系统。发送给输出子系统的数据,来源似乎都很可靠。然而,假设输出数据不必做无害化处理,是很危险的,因为这些数据可能间接来源于一个不可信的来源,并且可能包含恶意的内容。如果没能正确地处理传递给输出子系统的数据,就会让多种类型的攻击有机可乘。例如,HTML渲染器易受HTML注入攻击和跨站脚本(XSS)攻击[OWASP 2011]。因此,用于防止此类攻击的输出无害化处理,和输入无害化处理一样重要。

和输入验证一样,数据应该在消除恶意字符之前被标准化。正确编码所有输出字符,其中那些已知的、不会由于绕过数据验证而导致安全漏洞的字符除外。更多信息参见《The CERT® Oracle® Secure Coding Standard for Java™》[Long 2012]的“IDS01-J. Normalize strings before validating them”。

违规代码示例

下面的违规代码示例使用基于Java EE的Spring框架中的模型-视图-控制器(Model-View-Controller,MVC)概念,向用户显示了没有经过编码或转义的数据。因为数据会被发送到Web浏览器,所以该代码容易受到HTML注入攻击和XSS攻击。

@RequestMapping("/getnotifications.htm")
public ModelAndView getNotifications(
 HttpServletRequest request, HttpServletResponse response) {
 ModelAndView mv = new ModelAndView();
 try {
  UserInfo userDetails = getUserInfo();
  List<Map<String,Object>> list =
   new ArrayList<Map<String, Object>>();
  List<Notification> notificationList =
   NotificationService.getNotificationsForUserId(
    userDetails.getPersonId());

  for (Notification notification: notificationList) {
   Map<String,Object> map = new HashMap<String, Object>();
   map.put("id", notification.getId());
   map.put("message", notification.getMessage());
   list.add(map);
 }

  mv.addObject("Notifications", list);
 } catch (Throwable t) {
  // Log to file and handle
 }

 return mv;
}```
####合规解决方案
下面的合规解决方案定义了一个ValidateOutput类,这个类首先将输出规范化到了一个已知的字符集,然后使用白名单的对数据做了无害化处理,最后对所有未指明的数据值进行编码,强制执行了双重检查机制。注意,所需的白名单模式将根据不同字段的具体需求而变化[OWASP 2013]。

public class ValidateOutput {
 // Allows only alphanumeric characters and spaces
 private static final Pattern pattern =
  Pattern.compile("^[a-zA-Z0-9\s]{0,20}$");

 // Validates and encodes the input field based on a whitelist
 public String validate(String name, String input)
   throws ValidationException {
  String canonical = normalize(input);

  if (!pattern.matcher(canonical).matches()) {
   throw new ValidationException("Improper format in " +
                  name + " field");
  }

  // Performs output encoding for nonvalid characters
  canonical = HTMLEntityEncode(canonical);
  return canonical;
 }

 // Normalizes to known instances
 private String normalize(String input) {
  String canonical =
   java.text.Normalizer.normalize(input,
    Normalizer.Form.NFKC);
  return canonical;
 }

 // Encodes nonvalid data
 private static String HTMLEntityEncode(String input) {
  StringBuffer sb = new StringBuffer();

  for (int i = 0; i < input.length(); i++) {
   char ch = input.charAt(i);
   if (Character.isLetterOrDigit(ch) ||
      Character.isWhitespace(ch)) {
     sb.append(ch);
    } else {
     sb.append("" + (int)ch + ";");
    }
   }
   return sb.toString();
 }
}

// ...

@RequestMapping("/getnotifications.htm")
public ModelAndView getNotifications(HttpServletRequest request,
  HttpServletResponse response) {
 ValidateOutput vo = new ValidateOutput();

 ModelAndView mv = new ModelAndView(); 
 try {
  UserInfo userDetails = getUserInfo();
  List> list =
   new ArrayList>();
  List notificationList =
   NotificationService.getNotificationsForUserId(
    serDetails.getPersonId());

  for (Notification notification: notificationList) {
    Map map = new HashMap();
    map.put("id", vo.validate("id" ,notification.getId()));
    map.put("message",
     vo.validate("message", notification.getMessage()));
    list.add(map);
  }

  mv.addObject("Notifications", list);
 }
 catch (Throwable t) {
  // Log to file and handle
 }

 return mv;
}`
当接受危险的字符如双引号和尖括号时,必须对输出进行编码和转义。即使在输入白名单中不允许出现这样的字符,也要对输出进行转义,因为这样就提供了一个二级防御。注意,确切的转义序列会发生变化,具体取决于该输出将要被嵌入的地方。例如,HTML标签属性值、CSS、URL或者脚本中都可能会出现不可信输出,不同情况下的输出编码例程也会有所不同。另外,在有些上下文中,无法安全地使用不可信的数据。

适用性

在输出被显示前或被传递到可信边界前,没能对其进行编码或转义,导致任意代码的执行。

相关漏洞

据2006年1月报道,Apache GERONIMO-1474漏洞允许攻击者提交包含JavaScript的URL。网络访问日志查看器(Web Access Log Viewer)未能对跳转到管理员控制台的数据进行无害化处理,从而促成了一个典型的XSS攻击。

相关文章
|
1月前
|
Java
Java开发实现图片URL地址检验,如何编码?
【10月更文挑战第14天】Java开发实现图片URL地址检验,如何编码?
64 4
|
1月前
|
Java 流计算
利用java8 的 CompletableFuture 优化 Flink 程序
本文探讨了Flink使用avatorscript脚本语言时遇到的性能瓶颈,并通过CompletableFuture优化代码,显著提升了Flink的QPS。文中详细介绍了avatorscript的使用方法,包括自定义函数、从Map中取值、使用Java工具类及AviatorScript函数等,帮助读者更好地理解和应用avatorscript。
利用java8 的 CompletableFuture 优化 Flink 程序
|
28天前
|
Java
Java实现随机生成某个省某个市的身份证号?如何编码?
【10月更文挑战第18天】Java实现随机生成某个省某个市的身份证号?如何编码?
99 5
|
1月前
|
Java
Java开发实现图片地址检验,如果无法找到资源则使用默认图片,如何编码?
【10月更文挑战第14天】Java开发实现图片地址检验,如果无法找到资源则使用默认图片,如何编码?
56 2
|
2月前
|
XML 存储 JSON
Java程序部署
Java程序部署
|
1月前
|
存储 缓存 Java
java基础:IO流 理论与代码示例(详解、idea设置统一utf-8编码问题)
这篇文章详细介绍了Java中的IO流,包括字符与字节的概念、编码格式、File类的使用、IO流的分类和原理,以及通过代码示例展示了各种流的应用,如节点流、处理流、缓存流、转换流、对象流和随机访问文件流。同时,还探讨了IDEA中设置项目编码格式的方法,以及如何处理序列化和反序列化问题。
67 1
java基础:IO流 理论与代码示例(详解、idea设置统一utf-8编码问题)
|
1月前
|
Java Maven 数据安全/隐私保护
如何实现Java打包程序的加密代码混淆,避免被反编译?
【10月更文挑战第15天】如何实现Java打包程序的加密代码混淆,避免被反编译?
44 2
|
1月前
|
安全 Java Linux
java程序设置开机自启
java程序设置开机自启
|
1月前
|
运维 Java Linux
【运维基础知识】Linux服务器下手写启停Java程序脚本start.sh stop.sh及详细说明
### 启动Java程序脚本 `start.sh` 此脚本用于启动一个Java程序,设置JVM字符集为GBK,最大堆内存为3000M,并将程序的日志输出到`output.log`文件中,同时在后台运行。 ### 停止Java程序脚本 `stop.sh` 此脚本用于停止指定名称的服务(如`QuoteServer`),通过查找并终止该服务的Java进程,输出操作结果以确认是否成功。
36 1
|
2月前
|
消息中间件 分布式计算 Java
Linux环境下 java程序提交spark任务到Yarn报错
Linux环境下 java程序提交spark任务到Yarn报错
42 5