为什么'\x1B'.length === 1?\x与\u知识延伸

简介: 为什么'\x1B'.length === 1?\x与\u知识延伸

背景


先讲一下背景,再说原因


大多数库都会在日志中使用chalk库为console的内容进行上色


chalk处理后,其原本的内容会被‘\x1B...’所包裹


console.log(chalk.blue('green'));
console.log([chalk.blue('green')]);


网络异常,图片无法展示
|


在开发vite-plugin-monitor时,为了获取原始的日志内容(上色之前),需要将上色后的字符串还原


\x1B[34mgreen\x1B[39m => green


在使用正则处理内容的时候发现了一个问题


'\x1B'.replace(/\\x/,'') // 结果??


再通过.length查看其长度,结果就如标题所示


网络异常,图片无法展示
|


原因


反斜杠"\"通常标识转义字符,如\n(换行符),\t(制表符)

\x就标识16进制,后面跟上两位16进制数


与此同时还有\u也是标识16进制,但其后面需跟上4位16进制数

因此这里的\x1B实际上就是一个字符


'\x41' === 'A'   // true
'A' === '\u0041' // true


\x


\xhh匹配一个以两位十六进制数(\x00-\xFF)表示的字符


主要用于ASCII码的表示


'\x41' === ‘A’
'A' === String.fromCharCode(65)
'\x61' === ‘a’
'a' === String.fromCharCode(97)


\x后必须跟着两位16进制的字符,否则会报错,其中 A-F 不区分大小写


'\x1' // Uncaught SyntaxError: Invalid hexadecimal escape sequence
'\xfg' // Uncaught SyntaxError: Invalid hexadecimal escape sequence
复制代码


\u


\uhhhh匹配一个以四位十六进制数(\u0000-\uFFFF)表示的 Unicode 字符。

在正则表达式中常见于匹配中文字符


const r = /[\u4e00-\u9fa5]/
r.test('中文') // true
r.test('English') // false


字符串与Unicode互转


str2Unicode


  1. 使用String.prototype.charCodeAt获取指定位置的 Unicode 码点(十进制表示)
  2. 使用String.prototype.toString将其转为十六进制字符,转为16进制字符不会自动补0
  3. 通过String.prototype.padStart进行补0


编写的通用处理方法如下


function str2Unicode(str) {
    let s = ''
    for (const c of str) {
        s += `\\u${c.charCodeAt(0).toString(16).padStart(4, '0')}`
    }
    return s
}
str2Unicode('1a中文') // '\\u0031\\u0061\\u4e2d\\u6587'


unicode2Str


  1. 通过正则/\\u[\da-f]{4}/g匹配出所有的unicode字符
  2. 使用Number0x${matchStr}转换为10进制数
  3. 使用String.fromCodePoint将unicode码点转为字符
  4. 使用String.prototype.replace进行逐字符的转换


function unicode2Str(str) {
    const unicodeList = str.match(/\\u[\da-f]{4}/g) || []
    return unicodeList.reduce((pre, u) => {
        return pre.replace(u, String.fromCodePoint(Number(`0x${u.slice(2)}`)))
    }, str)
}
unicode2Str('1\\u0061\\u4e2d文') // 1a中文


还原chalk处理后的字符串


自己从0-1写一个正则难免会有许多边界情况考虑不周全,于是在chalk的README中找到了chalk/ansi-regex这个库


可以将色值相关的 ANSI转义码 匹配出来


import ansiRegex from 'ansi-regex';
'\u001B[4mcake\u001B[0m'.match(ansiRegex());
//=> ['\u001B[4m', '\u001B[0m']
'\u001B[4mcake\u001B[0m'.match(ansiRegex({onlyFirst: true}));
//=> ['\u001B[4m']


编写一下处理方法


function resetChalkStr(str) {
    return str.replace(ansiRegex(), '')
}


测试


console.log(chalk.green('green'), chalk.greenBright('greenBright'));
console.log([chalk.green('green'), chalk.greenBright('greenBright')]);
console.log(resetChalkStr(`${chalk.green('green')} ${chalk.greenBright('greenBright')}`));


网络异常,图片无法展示
|


总结


重拾了一下\x\u相关的内容,突然额外想到一个点,使用\u去做字符串的加解密(下来再捋一捋)

解决了一个chalk相关的问题:“还原终端中log的彩色内容”

相关文章
|
7月前
|
Web App开发 前端开发 JavaScript
大厂面试题分享:如何让(a===1&&a===2&&a===3)的值为true?
大厂面试题分享:如何让(a===1&&a===2&&a===3)的值为true?
|
7月前
|
Web App开发 前端开发 JavaScript
【面试题】大厂面试题分享:如何让(a===1&&a===2&&a===3)的值为true?
【面试题】大厂面试题分享:如何让(a===1&&a===2&&a===3)的值为true?
|
5月前
|
JavaScript 前端开发
continue、return、break三者的区别
continue、return、break三者的区别
|
5月前
|
前端开发 JavaScript
前端数组遍历循环的资料,let arr = [‘pink‘,‘red‘,‘blue‘] for (let k in arr){console.log(k),console.log(arr[k])}
前端数组遍历循环的资料,let arr = [‘pink‘,‘red‘,‘blue‘] for (let k in arr){console.log(k),console.log(arr[k])}
|
7月前
break,continue,return的区别深度剖析
break,continue,return的区别深度剖析
|
7月前
|
JavaScript
v-for=“item in arr“ 的理解
v-for=“item in arr“ 的理解
43 0
|
7月前
|
JavaScript 前端开发 安全
== 和 ===什么区别呀?
== 和 ===什么区别呀?
124 0
|
JavaScript 前端开发
== 和 ===区别,分别在什么情况使用
== 和 ===区别,分别在什么情况使用
82 1
|
前端开发
前端学习案例-arr.map(parseInt)没有参数1
前端学习案例-arr.map(parseInt)没有参数1
81 0
前端学习案例-arr.map(parseInt)没有参数1
|
前端开发 JavaScript C++
你真的理解==和===的区别吗?
用中文怎么叫合适? 相等?全等?
你真的理解==和===的区别吗?