std::wctomb
来自cppreference.com
在标头 <cstdlib> 定义
|
||
int wctomb( char* s, wchar_t wc ); |
||
转换宽字符 wc 为多字节编码并存储之(包含任何迁移序列)于首元素为 s 所指向的字符数组。不存储多于 MB_CUR_MAX 个字符。转换受当前本地环境的 LC_CTYPE 类别影响。
若 wc 是空字符,则将空字节写入 s,前附任何需要恢复到初始迁移状态的迁移序列。
若 s 是空指针,则重置全局转换状态并确定是否使用迁移序列。
参数
s | - | 指向输出的字符数组的指针 |
wc | - | 要转换的宽字符 |
返回值
若 s 不是空指针,则返回 wc 的多字节表示中的字节数,或若 wc 不是合法字符则为 -1。
若 s 是空指针,则重置其内部转换状态为表示初始迁移状态,且若当前多字节编码不依赖状态(不使用迁移序列)则返回 0,或若当前多字节编码以来状态(使用迁移序列)则返回非零值。
注解
每次到 wctomb
的调用更新全局转换状态(std::mbstate_t 类型静态对象,仅为此函数所知)。若多字节编码使用迁移状态,则此函数不可重入。任何情况下,多个线程不应调用 wctomb
而不同步:可用 std::wcrtomb 替代。
示例
运行此代码
#include <clocale> #include <cstdlib> #include <iomanip> #include <iostream> #include <string> void print_wide(const std::wstring& wstr) { bool shifts = std::wctomb(nullptr, 0); // 重置转换状态 std::cout << (shifts ? "" : "不" ) << "使用迁移序列\n" << std::uppercase << std::setfill('0'); for (const wchar_t wc : wstr) { std::string mb(MB_CUR_MAX, '\0'); const int ret = std::wctomb(&mb[0], wc); // const char* s = ret > 1 ? "s" : ""; std::cout << "多字节字符 '" << mb << "' 有 " << ret << " 个字节" << ": [" << std::hex; for (int i{0}; i != ret; ++i) { const int c = 0xFF & mb[i]; std::cout << (i ? " " : "") << std::setw(2) << c; } std::cout << "]\n" << std::dec; } } int main() { std::setlocale(LC_ALL, "en_US.utf8"); // UTF-8 窄多字节编码 std::wstring wstr = L"z\u00df\u6c34\U0001d10b"; // 或 L"zß水𝄋" print_wide(wstr); }
输出:
不使用迁移序列 多字节字符 'z' 有 1 个字节: [7A] 多字节字符 'ß' 有 2 个字节: [C3 9F] 多字节字符 '水' 有 3 个字节: [E6 B0 B4] 多字节字符 '𝄋' 有 4 个字节: [F0 9D 84 8B]
参阅
将下一个多字节字符转换成宽字符 (函数) | |
给定状态,转换宽字符到其多字节表示 (函数) | |
[虚] |
将字符串从 InternT 转换到 ExternT ,例如在写入文件时 ( std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数) |