推荐几个不错的字符串处理库

简介: 处理字符串可能是一项繁琐的工作,因为有许多不同的用例。

处理字符串可能是一项繁琐的工作,因为有许多不同的用例。

例如,一个简单的任务,如将字符串转换为骆驼字母,可能需要几行代码来实现最终目标,比如我们举个例子:

function camelize(str) {
  return str.replace(/(?:^\w|[A-Z]|\b\w|\s+)/g, function(match, index) {
    if (+match === 0) return ""; // or if (/\s+/.test(match)) for white spaces
    return index === 0 ? match.toLowerCase() : match.toUpperCase();
  });
}

上面的代码片段是StackOverflow中投票最多的答案。但这也不能解决字符串为---Foo---bAr---的情况。

 20210830143107608.jpg

                                                                      编者导语

这就是字符串操作库的用武之地。

字符串操作库使实现复杂的字符串操作变得很容易,而且还考虑到一个给定问题的所有可能的使用情况。

这对你来说很有帮助,因为你只需要调用一个方法就能得到一个有效的解决方案。

让我们来看看几个JavaScript的字符串操作库:

  • String.js
  • Voca
  • Stringz
  • Underscore String
  • Anchorme

 

一、String.js

该库是一个轻量级的(大小小于 5 kb的)JavaScript库,为浏览器或Node.js提供额外的String方法。

安装

npm i string

值得注意的方法

between(left, right)

在左右两个字符串之间提取一个字符串。当试图获得HTML中两个标签之间的元素时,可以使用这个方法。

var S = require('string');
S('<a>This is a link</a>').between('<a>', '</a>').s 
// 'This is a link'

camelize()

移除任何下划线或破折号,并将字符串转换为骆驼的大小写。

这个函数可以用来解决本文开头提到的问题。

var S = require('string');
S('---Foo---bAr---').camelize().s; 
//'fooBar'

humanize()

将输入的内容转化为对人友好的形式。

这个功能从头开始实现,肯定需要相当多的代码行。

 

var S = require('string');
S('   capitalize dash-CamelCase_underscore trim  ').humanize().s 
//'Capitalize dash camel case underscore trim'

 

stripPunctuation()

剥离给定字符串中所有的标点符号。

如果你从头开始实现这个功能,很有可能会漏掉一个标点符号。

var S = require('string');
S('My, st[ring] *full* of %punct)').stripPunctuation().s; 
//My string full of punct

 

更多的方法,参考下面的链接:

https://github.com/jprichardson/string.js

 

二、Voca

Voca是一个JavaScript字符串操作库。Voca库中提供了改变大小写、修剪、填充、审美化、截断、转义和其他有用的字符串操作方法。

为了减少应用程序的构建,模块化设计允许你加载完整的库或特定功能。该库已经过完整的测试,有完善的文档,并提供长期支持。

安装

npm i voca

值得注意的方法

Camel Case(String data)

将数据转换为骆驼的大小写。

var v = require('voca');
v.camelCase('foo Bar');
// => 'fooBar'
v.camelCase('FooBar');
// => 'fooBar'
v.camelCase('---Foo---bAr---');
// => 'fooBar'

Latinise(String data)

通过删除变音符对数据进行拉丁化处理。

var v = require('voca');
v.latinise('cafe\u0301'); // or 'café'
// => 'cafe'
v.latinise('août décembre');
// => 'aout decembre'
v.latinise('как прекрасен этот мир');
// => 'kak prekrasen etot mir'

isAlphaDigit(String data)

检查数据是否只包含字母和数字字符。(字母数字)

var v = require('voca');
v.isAlphaDigit('year2020');
// => true
v.isAlphaDigit('1448');
// => true
v.isAlphaDigit('40-20');
// => false

CountWords(String data)

计算数据中的字数:

var v = require('voca');
v.countWords('gravity can cross dimensions');
// => 4
v.countWords('GravityCanCrossDimensions');
// => 4
v.countWords('Gravity - can cross dimensions!');
// => 4

更多的方法,参考下面的链接:

https://vocajs.com/#

三、Anchorme.js

这是一个微小的、快速的Javascript库,有助于检测文本中的链接URLs or Emails,并将其转换为可点击的HTML锚链接。

它有以下几个优点:

  • 它是高度敏感的,误报率最低。
  • 它根据完整的IANA列表验证URL和Emails。
  • 验证端口号(如果存在)。
  • 验证IP八位数(如果存在)。
  • 对非拉丁字母的URLs起作用。

安装

npm i voca

使用方法

import anchorme from "anchorme"; 
//or 
//var anchorme = require("anchorme").default;
const input = "some text with a link.com"; 
const resultA = anchorme(input);
//some text with a <a href="http://link.com">link.com</a>

你可以传入额外的扩展来进一步定制该功能。

四、Underscore String

Underscore是JavaScript的字符串操作扩展,它为你提供了几个有用的功能:capitalize、clean、count、escapeHTML、unescapeHTML、insert、startsWith、 endsWith、titleize、truncate、trim等等。

安装

npm install underscore.string

值得注意的方法

numberFormat(number)

将数字格式化为具有小数和顺序分隔的字符串。

var _ = require("underscore.string");
_.numberFormat(1000, 3)
=> "1,000.000"
_.numberFormat(123456789.123, 5, '.', ',');
=> "123,456,789.12300"

chop(string, step)

通过删除变音符对数据进行拉丁化处理。

var v = require('voca');
v.latinise('cafe\u0301'); // or 'café'
// => 'cafe'
v.latinise('août décembre');
// => 'aout decembre'
v.latinise('как прекрасен этот мир');
// => 'kak prekrasen etot mir'

isAlphaDigit(String data)

将给定的字符串切成碎片

var _ = require("underscore.string");
_.chop('whitespace', 3);
=> ['whi','tes','pac','e']

更多的方法,参考下面的链接:

http://gabceb.github.io/underscore.string.site/#chop

五、Stringz

这个库的主要亮点是它能识别unicode。如果你运行下面这段代码,输出将是2。

"🤔".length
// -> 2

至于为什么长度是2,可以在这里阅读更多关于JavaScript unicode代码问题的信息。

https://mathiasbynens.be/notes/javascript-unicode

 

安装

npm install stringz

值得注意的方法

limit(string, limit, padString, padPosition)

将字符串限制在一个给定的宽度。

const stringz = require('stringz');
// Truncate:
stringz.limit('Life’s like a box of chocolates.', 20); 
// "Life's like a box of"
// Pad:
stringz.limit('Everybody loves emojis!', 26, '💩'); 
// "Everybody loves emojis!💩💩💩"
stringz.limit('What are you looking at?', 30, '+', 'left'); 
// "++++++What are you looking at?"
// Unicode Aware:
stringz.limit('🤔🤔🤔', 2); 
// "🤔🤔"
stringz.limit('👍🏽👍🏽', 4, '👍🏽'); 
// "👍🏽👍🏽👍🏽👍🏽"

 

toArray(string)

将字符串转换为数组。

const stringz = require('stringz');
stringz.toArray('abc');
// ['a','b','c']
//Unicode aware
stringz.toArray('👍🏽🍆🌮');
// ['👍🏽', '🍆', '🌮']
相关文章
|
存储 程序员 编译器
4.1 C++ Boost 字符串处理库
Boost 库是一个由C/C++语言的开发者创建并更新维护的开源类库,其提供了许多功能强大的程序库和工具,用于开发高质量、可移植、高效的C应用程序。Boost库可以作为标准C库的后备,通常被称为准标准库,是C标准化进程的重要开发引擎之一。使用Boost库可以加速C应用程序的开发过程,提高代码质量和性能,并且可以适用于多种不同的系统平台和编译器。Boost库已被广泛应用于许多不同领域的C++应用程序开发中,如网络应用程序、图像处理、数值计算、多线程应用程序和文件系统处理等。
300 0
|
4月前
|
开发者 Python
Python字符串处理实用技巧
【7月更文挑战第25天】本文汇总了20项Python字符串处理的实用技巧,包括使用`split()`与`join()`方法进行字符串分割与连接,利用`strip()`去除空白字符,借助列表推导式处理字符串列表,以及采用`startswith()`和`endswith()`检查字符串边界。此外,还介绍了`replace()`方法替换子串、`find()`及`index()`定位子串位置、`count()`统计子串出现次数、使用切片操作截取子串、正则表达式进行复杂匹配、字符串类型判断方法如`isalpha()`和`isdigit()`、字符串大小写转换与规范化(`lower()`, `upper(
56 1
|
6月前
|
数据挖掘 程序员 索引
探索Python的字符串操作和正则表达式
【4月更文挑战第8天】Python以其优雅的语法和强大的文本处理能力,让处理文本数据变得简单有趣。本文介绍了字符串操作和正则表达式的应用。在Python中,字符串是字符序列,支持拼接、索引和切片。正则表达式则提供灵活的模式匹配,用于查找、替换和分割文本。通过`re`模拝,我们可以实现对特定模式的精准匹配,如查找不分大小写的&quot;Python&quot;,或替换电子邮件地址为星号。学习和掌握这些工具,将使你在文本处理任务中更加高效,成为信息时代的艺术家。
30 1
|
11月前
|
自然语言处理 数据挖掘 Python
10 个有用的 Python 字符串函数
10 个有用的 Python 字符串函数
113 0
|
缓存 Python Perl
python | 正则表达式re库常用方法介绍
python | 正则表达式re库常用方法介绍
153 0
正则表达式——re库的一些常用函数
正则表达式——re库的一些常用函数
|
索引 Python
python基础—字符串操作
(1)字符串: Python内置了一系列的数据类型,其中最主要的内置类型是数值类型、文本序列(字符串)类型、序列(列表、元组和range)类型、集合类型、映射(字典)类型。本章在介绍字符串、列表、元组和range类型共有的通用序列操作方法的基础上,详细讲解字符串类型的创建、表示、字符串遍历、字符串操作、字符串处理方法和格式化等内容。并以random库的一些应用为例讲授字符串的实际应用,同时进一步加强流程控制语句的相关知识的应用训练。
124 0
|
C语言 索引
字符串标准库
字符串标准库
94 1
|
Python
Python编程:re正则库
Python编程:re正则库
118 0
|
机器学习/深度学习 移动开发 索引
Python - 字符串常用函数详解
Python - 字符串常用函数详解
117 0