关于获取字符串的长度

简介:

原文:http://blog.csdn.net/space_v/article/details/303418

我们都知道如何获得字串的长度。例如,如果我们已经像下面这样定义了一个字串指标:

char * pc = "Hello!" ;

我们可以呼叫

iLength = strlen (pc) ;

这时变数iLength将等於6,也就是字串中的字元数。

太好了!现在让我们试著定义一个指向宽字元的指标:

wchar_t * pw = L"Hello!" ;

再次呼叫strlen :

iLength = strlen (pw) ;

现在麻烦来了。首先,C编译器会显示一条警告消息,可能是这样的内容:

'function' : incompatible types - from 'unsigned short *' to 'const char *'

这条消息的意思是:宣告strlen函式时,该函式应接收char类型的指标,但它现在却接收了一个unsigned short类型的指标。您仍然可编译并执行该程式,但您会发现iLength等於1。为什么?

字串「Hello!」中的6个字元占用16位元:

0x0048 0x0065 0x006C 0x006C 0x006F 0x0021

Intel处理器在记忆体中将其存为:

48 00 65 00 6C 00 6C 00 6F 00 21 00

假定strlen函式正试图得到一个字串的长度,并把第1个位元组作为字元开始计数,但接著假定如果下一个位元组是0,则表示字串结束。

这个小练习清楚地说明了C语言本身和执行时期程式库函式之间的区别。编译器将字串L"Hello!" 解释为一组16位元短整数型态资料,并将其保存在wchar_t阵列中。编译器还处理阵列索引和sizeof操作符,因此这些都能正常工作,但在连结时才添加执行时期程式库函式,例如strlen。这些函式认为字串由单位元组字元组成。遇到宽字串时,函式就不像我们所希望那样执行了。

您可能要说:「噢,太麻烦了!」现在每个C语言程式库函式都必须重写以接受宽字元。但事实上并不是每个C语言程式库函式都需要重写,只是那些有字串参数的函式才需要重写,而且也不用由您来完成。它们已经重写完了。

strlen函式的宽字元版是wcslen(wide-character string length:宽字串长度),并且在STRING.H(其中也说明了strlen)和WCHAR.H中均有说明。strlen函式说明如下:

size_t __cdecl strlen (const char *) ;

而wcslen函式则说明如下:

size_t __cdecl wcslen (const wchar_t *) ;

这时我们知道,要得到宽字串的长度可以呼叫

iLength = wcslen (pw) ;

函式将返回字串中的字元数6。请记住,改成宽位元组後,字串的字元长度不改变,只是位元组长度改变了。

您熟悉的所有带有字串参数的C执行时期程式库函式都有宽字元版。例如,wprintf是printf的宽字元版。这些函式在WCHAR.H和含有标准函式说明的表头档案中说明。


相关文章
求字符串的长度
var   s:string;   lvAnsiStr:AnsiString; begin   lvAnsiStr := '中国';   Writeln(Length(lvAnsiStr));   lvAnsiStr := UTF8Encode('中国');   ...
795 0
|
10月前
求一个字符串的长度
求一个字符串的长度。
89 11
|
存储 C# 自然语言处理
C#字符串(字节)的长度
这么简单的问题,我都忘记了,不知道你们还记得吗,希望你们都还记得? using System; public class Test { public static void Main() { string str1 = "abced.
853 0
|
5月前
|
人工智能
字符串转换后的长度
【10月更文挑战第10天】字符串转换后的长度I,字符串转换后的长度II
48 1
字符串中的转义字符与字符串的长度
提示: (1)计算字符串长度时关键是要注意辨认转义字符; (2)一个转义字符总是以反斜杠开始,再加一个其他字符组成。所以,遇到反斜杠时要特别注意!!! 示例: 1、不带转义字符的字符串   如:“abc!x=/”,strlen求其长度为 7,但是因为字符串在末尾还有一个终止符‘\0’,因此字符串占8个字节,长度为8.
1738 0
|
存储 编解码 缓存
|
C++ 编译器 数据格式
c++ new长度为0的数组
在程序中发现一下代码: int CHmcVideoMgt ::OnGetDiskRunningInfo( SOCKETPARAM *pSocketInfo ,Json:: Value Param ) { int iArrayLen = Param[ _T("NUM" )].
1501 0
|
C++
C++中从一个字符串中截取另一长度的子字符串
C++中从一个字符串中截取另一长度的子字符串
95 0