©
Dokumen ini menggunakan Manual laman web PHP Cina Lepaskan
在头文件<wchar.h>中定义 | ||
---|---|---|
(1) | ||
size_t mbsrtowcs(wchar_t * dst,const char * src,size_t len,mbstate_t * ps); | (自C95以来) | |
size_t mbsrtowcs(wchar_t * restrict dst,const char ** restrict src,size_t len,mbstate_t * restrict ps); | (自C99以来) | |
errno_t mbsrtowcs_s(size_t * restrict retval,wchar_t * restrict dst,rsize_t dstsz,const char ** restrict src,rsize_t len,mbstate_t * restrict ps); | (2) | (自C11以来) |
1)将由* ps描述的转换状态开始的以空字符结尾的多字节字符序列从第一个元素由* src指向的数组转换为宽字符表示形式。 如果dst不为空,则转换的字符将存储在由dst指向的wchar_t数组的连续元素中。 不超过len宽字符被写入目标数组。 每个多字节字符转换就像通过调用mbrtowc。 在下列情况下停止转换:
*多字节空字符已转换并存储。*src
设置为NULL
与*ps
,表示初始转换状态。
*遇到了一个无效的多字节字符(根据当前的C语言环境)。*src
被设置为指向第一个未转换的多字节字符的开始处。
*如果src和dst重叠,则行为未指定。
*在运行时检测到以下错误并调用当前安装的约束处理函数:
retval,ps,src或* src是空指针
dstsz或len大于RSIZE_MAX / sizeof(wchar_t)(除非dst为空)
dstsz不为零(除非dst为空)
* src数组中的第一个dstsz多字节字符中没有空字符,并且len大于dstsz(除非dst为空)
作为所有边界检查函数,只有当__STDC_LIB_EXT1__由实现定义并且在包含wchar.h之前用户将__STDC_WANT_LIB_EXT1__定义为整数常量1时,mbsrtowcs_s才能保证可用。
dst | - | 指向宽字符数组的地方,结果将被存储 |
---|---|---|
src | - | 指向指向空终止的多字节字符串的第一个元素的指针 |
len | - | 由dst指向的数组中可用的宽字符数 |
ps | - | 指向转换状态对象的指针 |
dstsz | - | 将写入的最大宽字符数(dst数组的大小) |
retval | - | 指向将存储结果的size_t对象的指针 |
1)成功时,返回写入字符数组中的宽字符数,不包括终止的L'\ 0'。 如果dst == NULL,则返回给定无限长度的宽字符数。 在转换错误(如果遇到无效多字节字符)时,返回(size_t)-1,将EILSEQ存储在errno中,并使* ps处于未指定状态。
2)成功时为零(在这种情况下,不包括终止零的宽字符的数量已经或将被写入dst,存储在* retval中),非错误发生。 在违反运行时约束的情况下,* retval中的stores(size_t)-1(除非retval为null)并将dst [0]设置为L'\ 0'(除非dst为null或dstmax为零或大于RSIZE_MAX)
dst | - | 指向宽字符数组的地方,结果将被存储 |
---|---|---|
src | - | 指向指向空终止的多字节字符串的第一个元素的指针 |
len | - | 由dst指向的数组中可用的宽字符数 |
ps | - | 指向转换状态对象的指针 |
dstsz | - | 将写入的最大宽字符数(dst数组的大小) |
retval | - | 指向将存储结果的size_t对象的指针 |
#include <stdio.h>#include <locale.h>#include <wchar.h>#include <string.h> void print_as_wide(const char* mbstr){ mbstate_t state; memset(&state, 0, sizeof state); int len = 1 + mbsrtowcs(NULL, &mbstr, 0, &state); wchar_t wstr[len]; mbsrtowcs(&wstr[0], &mbstr, len, &state); wprintf(L"Wide string: %ls \n", wstr); wprintf(L"The length, including L'\\0': %d\n", len);} int main(void){ setlocale(LC_ALL, "en_US.utf8"); print_as_wide(u8"z\u00df\u6c34\U0001f34c"); // u8"zß水?"}
1)成功时,返回写入字符数组中的宽字符数,不包括终止的L'\ 0'。 如果dst == NULL,则返回给定无限长度的宽字符数。 在转换错误(如果遇到无效多字节字符)时,返回(size_t)-1,将EILSEQ存储在errno中,并使* ps处于未指定状态。
输出:
#include <stdio.h>#include <locale.h>#include <wchar.h>#include <string.h> void print_as_wide(const char* mbstr){ mbstate_t state; memset(&state, 0, sizeof state); int len = 1 + mbsrtowcs(NULL, &mbstr, 0, &state); wchar_t wstr[len]; mbsrtowcs(&wstr[0], &mbstr, len, &state); wprintf(L"Wide string: %ls \n", wstr); wprintf(L"The length, including L'\\0': %d\n", len);} int main(void){ setlocale(LC_ALL, "en_US.utf8"); print_as_wide(u8"z\u00df\u6c34\U0001f34c"); // u8"zß水?"}
C11标准(ISO / IEC 9899:2011):
7.29.6.4.1 mbsrtowcs函数(p:445)
K.3.9.3.2.1 mbsrtowcs_s函数(p:648-649)
C99标准(ISO / IEC 9899:1999):
7.24.6.4.1 mbsrtowcs函数(p:391)
mbstowcsmbstowcs_s(C11) | 将窄多字节字符串转换为宽字符串(函数) |
---|---|
mbrtowc(C95) | 将下一个多字节字符转换为宽字符,给定状态(函数) |
wcsrtombswcsrtombs_s(C95)(C11) | 将宽字符串转换为窄多字节字符串,给定状态(函数) |
C11标准(ISO / IEC 9899:2011):
7.29.6.4.1 mbsrtowcs函数(p:445)
K.3.9.3.2.1 mbsrtowcs_s函数(p:648-649)
C99标准(ISO / IEC 9899:1999):
7.24.6.4.1 mbsrtowcs函数(p:391)
mbstowcsmbstowcs_s(C11) | 将窄多字节字符串转换为宽字符串(函数) |
---|---|
mbrtowc(C95) | 将下一个多字节字符转换为宽字符,给定状态(函数) |
wcsrtombswcsrtombs_s(C95)(C11) | 将宽字符串转换为窄多字节字符串,给定状态(函数) |
| mbsrtowcs的C ++文档 |
本文档系腾讯云云+社区成员共同维护,如有问题请联系 yunjia_community@tencent.com
在头文件<wctype.h>中定义 | ||
---|---|---|
int iswdigit(wint_t ch); | (自C95以来) |
检查给定的宽字符是否对应(如果缩小)十个十进制数字字符0123456789中的一个。
CH | - | 宽字符 |
---|
如果宽字符是数字字符,则为非零值,否则为零。
iswdigit
与iswxdigit
是唯一不受当前安装的C语言环境影响的标准宽字符分类函数。
一些语言环境提供了检测非ASCII数字的附加字符类。
#include <stdio.h>#include <wctype.h>#include <wchar.h>#include <locale.h> void test(wchar_t a3, wchar_t u3, wchar_t j3){ printf(" '%lc' '%lc' '%lc'\n", a3, u3, j3); printf("iswdigit %d %d %d\n", !!iswdigit(a3), !!iswdigit(u3), !!iswdigit(j3)); printf("jdigit: %d %d %d\n", !!iswctype(a3, wctype("jdigit")), !!iswctype(u3, wctype("jdigit")), !!iswctype(j3, wctype("jdigit")));} int main(void){ wchar_t a3 = L'3'; // the ASCII digit 3 wchar_t u3 = L'三'; // the CJK numeral 3 wchar_t j3 = L'3'; // the fullwidth digit 3 setlocale(LC_ALL, "en_US.utf8"); puts("In American locale:"); test(a3, u3, j3); setlocale(LC_ALL, "ja_JP.utf8"); puts("\nIn Japanese locale:"); test(a3, u3, j3);}
输出:
In American locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 0 In Japanese locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 1
C11标准(ISO / IEC 9899:2011):
7.30.2.1.5 iswdigit函数(p:449)
C99标准(ISO / IEC 9899:1999):
7.25.2.1.5 iswdigit函数(p:395)
isdigit | 检查一个字符是否是一个数字(功能) |
---|
| 用于iswdigit的C ++文档 |
ASCII 值 (十六进制) | 字符 | iscntrl iswcntrl. | isprint iswprint. | isspace iswspace. | isblank iswblank. | isgraph iswgraph. | ispunct iswpunct. | isalnum iswalnum. | isalpha iswalpha. | isupper iswupper. | islower iswlower. | isdigit iswdigit. | isxdigit iswxdigit. | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 - 8 | 0x00-0x08 | 控制码 (NUL, etc.) | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
9 | 0x09 | tab (\t) | ≠0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
10 - 13 | 0x0A-0x0D | 空格 (\n,\v,\f,\r) | ≠0 | 0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
14 - 31 | 0x0E-0x1F | 控制码 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
32 | 0x20 | space | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
33 - 47 | 0x21-0x2F | !"#$%&'()*+,-./ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
48 - 57 | 0x30-0x39 | 0123456789 | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | 0 | 0 | 0 | ≠0 | ≠0 |
58 - 64 | 0x3a-0x40 | :;<=>?@ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
65 - 70 | 0x41-0x46 | ABCDEF | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | ≠0 |
71 - 90 | 0x47-0x5A | GHIJKLMNOPQRSTUVWXYZ | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | 0 |
91 - 96 | 0x5B-0x60 | []^_` | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | | ||||||||||||
97 -102 | 0x61-0x66 | abcdef | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | 0 | ≠0 | 0 | ≠0 |
103-122 | 0x67-0x7A | ghijklmnopqrstuvwxyz | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | 0 | ≠0 | 0 | 0 |
123-126 | 0x7B-0x7E | {|}~ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
127 | 0x7F | 退格 (DEL) | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |