如何理解data URL?

简介: canvas有一个非常常用的方法canvas.toDataURL(),它会将canvas转化为data URL的格式。通常情况下这个data URL的类型为image。

image.png


看看下面的例子:

<canvas id="canvas" height="2" width="2"></canvas>
var canvas = document.getElementById('canvas');
var dataURL = canvas.toDataURL();
console.log(dataURL);
/*
* 
*/

那么这个以data:[MIME type];base64,开头的data URL到底是什么东西呢?

  • 初识data URL
  • data URL与传统的url有什么区别?
  • data URL在浏览器地址栏输入后是怎样的?
  • data URL语法
  • data URL由哪四部分组成?
  • [<mediatype>]详情
  • [;base64]<data>详情
  • 常见的data URL形式
  • 字符串base64编解码的多种语言实现
  • 为什么要用base64来表示data URL中的<data>?
  • unix,javascript,node,python,php,java,.net实现base64编码
  • data URL常见问题


初识data URL


  • data URL是一种特殊格式的url,它的前缀是data:
  • data URL允许内容的创建者将小文件嵌入在documents中
  • 过去被叫做data URIs,直到WHATWG将其更名为data URL(s)


data URL与传统的url有什么区别?


现代浏览器将data url视作唯一的不透明来源,而不是负责导航的url。

如何理解这句话呢?看一下这个例子:


// data URL

// 传统的URL
https://www.google.com

由上面的结果可以看出:

data URL与传统的url不同。

传统的url在浏览器地址栏中输入,可以直接导航到目标地址;而data URL则是一个data的url表现,可以理解为用url代表数据。

通常情况下,这里的数据指代的是图片。


data URL在浏览器地址栏输入后是怎样的?


通常情况下,可以看到这个url代表的图片。


<!DOCTYPE html>
<html lang="en">
  <body>
    <canvas id="canvas"></canvas>
  </body>
  <script>
    var canvas = document.getElementById("canvas");
    var ctx = canvas.getContext("2d");
    ctx.font = "48px serif";
    ctx.fillText("Hello Canvassssssssss", 0, 75 + 24);
    var dataURL = canvas.toDataURL();
    console.log(dataURL);
  </script>
</html>



image.png


data URL语法


data URL由哪四部分组成?


data:[<mediatype>][;base64],<data>

组成 含义
data: 前缀
[<mediatype>] MIME type 代表数据的类型
[;base64] 可选的base64标识
<data> 数据本身


[<mediatype>]详情

  • mediatype是一个MIME type的字符串,比如'image/jpeg'。
  • 如果忽略的话,默认是"text/plain;charset=US-ASCII"。
  • canvas.toDataURL()并没有忽略,默认MIMIE type为"image/png"。
    [;base64]<data>详情
  • 如果data是纯文本,你可以简单的嵌入文本(根据document类型使用适当的实体或者转义)。
  • 如果data不是纯文本的话,可以标识为base64,并且嵌入base64编码的二进制数据。


常见的data URL形式


  • 简单的text/plain数据
  • 简单的text/palin数据的base64形式
  • HTML片段:普通标签
  • HTML片段:执行js的script标签
简单的text/plain数据


Hello World!

data:,Hello%2C%20World! // MIME type和;base64都没有,data和数据间只有`:,`
````
注意引号和空格的percent-encoding(URL-encoding)。
对于CSV数据(”text/csv“),percent-encoding需要保留分隔电子表格行的行尾。
##### 简单的text/palin数据的base64形式
`Hello World!`

data:text/plain;base64,SGVsbG8sIFdvcmxkIQ==

##### HTML片段:普通标签
`<h1>Hello, World!</h1>`


data:text/html,%3Ch1%3EHello%2C%20World!%3C%2Fh1%3E

##### HTML片段:执行js的script标签
`<script>alert('hi');</script>`

data:text/html,<script>alert('hi');</script>

执行js的script标签,注意闭script标签是需要的。
### 字符串base64编解码的多种语言实现
#### 为什么要用base64来表示data URL中的`<data>`?
- base64字符串是用64进制来表示二进制数据的,它是一个ASCII字符串。
- 由于仅仅是通过ASCII字符组成的,所以**base64字符串是url-safe的,因此才将base64应用于data URL的`<data>`中。**
#### unix,javascript,node,python,php,java,.net实现base64编码


"foo@gmail.com"

"Zm9vQGdtYWlsLmNvbQ=="

##### 1.unix (author: Peng Zhao)
解码:`echo "Zm9vQGdtYWlsLmNvbQ==" | base64 -D`
编码:`echo "foo@gmail.com" | base64`
##### 2.javascript (author: Kai Gao)

var encodedData = window.btoa("foo@gmail.com"); // 编码

var decodedData = window.atob("Zm9vQGdtYWlsLmNvbQ=="); // 解码

console.log(encodedData,decodedData)


##### 3.nodejs (author: Kai Gao)

//base64编码

var b = new Buffer("foo@gmail.com");

var s = b.toString('base64')

console.log("邮箱编码:"+s)

//base64解码

var b = new Buffer("Zm9vQGdtYWlsLmNvbQ==","base64")

var s = b.toString();

console.log("邮箱解码:"+s)



##### 4.python (author: Peng Zhao)

import base64

base64.b64encode("foo@gmail.com")

base64.b64decode("Zm9vQGdtYWlsLmNvbQ==")


##### 5.php (author: Chuang Shen)

<?php

$a = 'foo@gmail.com';

$b = base64_encode($a);//编码
echo $b;
$c = base64_decode($b);//解码
echo $c;  

?>

##### 6.java (author: Chuang Shen)

String str = "foo@gmail.com";

    String encodeStr = new String(Base64.encode(str.getBytes()));
    System.out.println(encodeStr);
    String decodeStr = Base64.base64Decode(encodeStr);
    System.out.println(decodeStr);
##### 7..net  (author: Peng Li)


static void Main(string[] args)


    {
        Console.WriteLine("输入:");
        var str = Console.ReadLine();
        //加密
        byte[] EncryptionByte = Encoding.UTF8.GetBytes(str);
        var EncryptionStr = Convert.ToBase64String(EncryptionByte);
        Console.WriteLine("加密结果:" + EncryptionStr);
        //解密
        byte[] DecryptionByte = Convert.FromBase64String(EncryptionStr);
        var DecryptionStr = Encoding.UTF8.GetString(DecryptionByte);
        Console.WriteLine("解密结果:" + DecryptionStr);
    }
查看[字符串base64编解码的多种语言实现](https://github.com/FrankKai/FrankKai.github.io/issues/4)弄清base64多语言实现的来龙去脉。
### data URL常见问题
罗列一些在创建和使用data URL时的常见问题。

data:text/html,lots of text...<p>bottom?arg=val

其实它代表的是:

lots of text...<p>bottom?arg=val

- 语法
- HTML中的格式
- 长度限制
- 异常处理的缺失
- 不支持字符串查询
- 安全问题
#### 语法
data URL的格式非常简单,很容易忘记在data前面添加一个逗号,或者是错误的将数据编码为base64格式。
#### HTML中的格式
data URL在文件中提供了一个文件,这个文件相对于闭文档的宽度可能非常宽。
作为一URL,data应该将空白格式化好(换行、tab、或者空格),但是在使用base64编码时会有一些问题。
#### 长度限制
尽管firefox支持无现场的data URL长度,但是浏览器不需要支持任何最大特定长度的数据。例如Opera 11浏览器将URL的长度限制到65535,data URL限制到65529(65529指的是base64 encoded后的`<data>`长度)。
##### 主流浏览器data URL长度限制
>- Chrome - 2MB for the current document. Otherwise the limit is the in-memory storage limit for - arbitrary blobs: if x64 and NOT ChromeOS or Android, then 2GB; otherwise, total_physical_memory / 5 (source).
>- Firefox - unlimited
>- IE ≥ 9 & Edge - 4GB
引自:[Data protocol URL size limitations](https://stackoverflow.com/questions/695151/data-protocol-url-size-limitations)
#### 异常处理的缺失
media的无效参数,或者‘base64’排版错误,都会被忽略,但是**不会报错出来**。
#### 不支持字符串查询
data URL的数据部分是不透明的,所以如果使用query string(比如`<url>?parameter-data`)去查询时,将只在数据中包含URL的查询字符串。也就是说查询无效,query也会被当做数据的一部分。
#### 安全问题
许多安全问题(如网络钓鱼)都与data url相关,并在浏览器的顶层导航到它们。
为了解决这些问题,在Firefox 59+中(发布版本,从58开始),对数据的顶层导航data:// urls已经被禁止。
参考资料:
- https://developer.mozilla.org/en-US/docs/Web/API/HTMLCanvasElement/toDataURL
- https://developer.mozilla.org/en-US/docs/Web/HTTP/Basics_of_HTTP/Data_URIs
>期待和大家交流,共同进步:
>- 微信公众号: 大大大前端 / excellent_developers



相关文章
|
4月前
|
前端开发 JavaScript 安全
AJAX - $().load(url,data,function(response,status,xhr))
AJAX - $().load(url,data,function(response,status,xhr))
29 0
|
4月前
|
JSON 数据格式
这个错误信息表示在执行`requests.post(url, data=data, headers=head).json()`时出现了问题
这个错误信息表示在执行`requests.post(url, data=data, headers=head).json()`时出现了问题
39 2
CL_FXS_URL_DATA_FETCHER - a good utility to fetch picture binary data according to url
CL_FXS_URL_DATA_FETCHER - a good utility to fetch picture binary data according to url
CL_FXS_URL_DATA_FETCHER - a good utility to fetch picture binary data according to url
|
C#
如何将图片内嵌到 Markdown 文档中,Markdown 如何使用 Data URL
我在云栖社区的聚能聊中发布了一个话题:“markdown编辑器与富文本编辑器之争,哪一个你最钟情?”。 其中有回复提到: markdown轻巧归轻巧,但也有硬伤,比如插入的图片如何保存的问题。几乎所有的markdown工具都会把图片单独保存在一个地方,这就是说你把自己的.md文件拷贝给别人的时候,还得把图片一并拷给他,而且路径要一模一样!这是妈蛋工具最大的吐槽点,图片就是处理的不好,就是这一点比不上office。
2010 0
|
前端开发 JavaScript 数据格式
JQuery ajax url传值与data传值的区别
url传中文,乱码,即便charset为 UTF-8, $.ajax({    type: "POST",    cache: false,    url: "/ProductTypeAndCat/AddType?typeName=" + typeName,    contentType: "application/x-www-form-urlencoded; charset=UTF-8",    datatype: "JSON",}); data传中文,正确。
769 0
|
C#
Data Url生成工具C#版 第二版
为什么有第二版   首先感谢 jenlynn 同学的留言“DATA URL两种生成方式,C#和HTML5 两者同一张生成的base64编码貌似不一样,能有什么方法让他们达成一致吗”。
650 0
|
Web App开发 JavaScript 前端开发
用Visual Studio 2010编写Data Url生成工具C#版
声明:本文系本人依照真实经历原创,未经许可,谢绝转载。 此文百度经验版本:如何用Visual Studio 2010打造Data Url生成工具 源码下载:用Visual Studio 2010编写Data Url生成工具C#源码 什么是Data Url呢?Data URI scheme是在RFC2397中定义的,目的是将一些小的数据,直接嵌入到网页中,从而不用再从外部文件载入。
843 0
|
Web App开发 移动开发 JavaScript
Data Url生成工具之HTML5 FileReader实现
百度经验版本:如何用HTML5的FileReader生成Data Url 上一篇讲了:用Visual Studio 2010编写Data Url生成工具C#版 今天用HTML5 FileReader实现了一下Data Url生成工具,上代码吧:
770 0
|
22天前
|
JavaScript
vue截取URL中的参数
vue截取URL中的参数
13 0