std::wctomb

来自cppreference.com
< cpp‎ | string‎ | multibyte
在标头 <cstdlib> 定义
int wctomb( char* s, wchar_t wc );

转换宽字符 wc 为多字节编码并存储之(包含任何迁移序列)于首元素为 s 所指向的字符数组。不存储多于 MB_CUR_MAX 个字符。转换受当前本地环境的 LC_CTYPE 类别影响。

wc 是空字符,则将空字节写入 s,前附任何需要恢复到初始迁移状态的迁移序列。

s 是空指针,则重置全局转换状态并确定是否使用迁移序列。

参数

s - 指向输出的字符数组的指针
wc - 要转换的宽字符

返回值

s 不是空指针,则返回 wc 的多字节表示中的字节数,或若 wc 不是合法字符则为 -1

s 是空指针,则重置其内部转换状态为表示初始迁移状态,且若当前多字节编码不依赖状态(不使用迁移序列)则返回 0,或若当前多字节编码以来状态(使用迁移序列)则返回非零值。

注解

每次到 wctomb 的调用更新全局转换状态(std::mbstate_t 类型静态对象,仅为此函数所知)。若多字节编码使用迁移状态,则此函数不可重入。任何情况下,多个线程不应调用 wctomb 而不同步:可用 std::wcrtomb 替代。

示例

#include <clocale>
#include <cstdlib>
#include <iomanip>
#include <iostream>
#include <string>
 
void print_wide(const std::wstring& wstr)
{
    bool shifts = std::wctomb(nullptr, 0); // 重置转换状态
    std::cout << (shifts ? "" : "不" )
              << "使用迁移序列\n" << std::uppercase << std::setfill('0');
    for (const wchar_t wc : wstr)
    {
        std::string mb(MB_CUR_MAX, '\0');
        const int ret = std::wctomb(&mb[0], wc);
        // const char* s = ret > 1 ? "s" : "";
        std::cout << "多字节字符 '" << mb << "' 有 " << ret
                  << " 个字节" << ": [" << std::hex;
        for (int i{0}; i != ret; ++i)
        {
            const int c = 0xFF & mb[i];
            std::cout << (i ? " " : "") << std::setw(2) << c;
        }
        std::cout << "]\n" << std::dec;
    }
}
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 窄多字节编码
    std::wstring wstr = L"z\u00df\u6c34\U0001d10b"; // 或 L"zß水𝄋"
    print_wide(wstr);
}

输出:

不使用迁移序列
多字节字符 'z' 有 1 个字节: [7A]
多字节字符 'ß' 有 2 个字节: [C3 9F]
多字节字符 '水' 有 3 个字节: [E6 B0 B4]
多字节字符 '𝄋' 有 4 个字节: [F0 9D 84 8B]

参阅

将下一个多字节字符转换成宽字符
(函数)
给定状态,转换宽字符到其多字节表示
(函数)
[虚]
将字符串从 InternT 转换到 ExternT,例如在写入文件时
(std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数)