std::wctomb

来自cppreference.com
< cpp‎ | string‎ | multibyte
定义于头文件 <cstdlib>
int wctomb( char *s, wchar_t wc );

转换宽字符 wc 为多字节编码并存储之(包含任何迁移序列)于首元素为 s 所指向的字符数组。不存储多于 MB_CUR_MAX 个字符。

wc 是空字符,则将空字节写入 s ,前附任何需要恢复到初始迁移状态的迁移序列。

s 是空指针,则重置全局转换状态并确定是否使用迁移序列。

参数

s - 指向输出的字符数组的指针
wc - 要转换的宽字符

返回值

s 不是空指针,则返回 wc 的多字节表示中的字节数,或若 wc 不是合法字符则为 -1

s 是空指针,则重置其内部转换状态为表示初始迁移状态,且若当前多字节编码不依赖状态(不使用迁移序列)则返回 0 ,或若当前多字节编码以来状态(使用迁移序列)则返回非零值。

注意

每次到 wctomb 的调用更新全局转换状态( std::mbstate_t 类型静态对象,仅为此函数所知)。若多字节编码使用迁移状态,则此函数不可重入。任何情况下,多个线程不应调用 wctomb 而不同步:可用 std::wcrtomb 替代。

示例

#include <iostream>
#include <clocale>
#include <string>
#include <cstdlib>
 
void print_wide(const std::wstring& wstr)
{
    bool shifts = std::wctomb(nullptr, 0); // 重置转换状态
    std::cout << "shift sequences " << (shifts ? "are" : "not" ) << " used\n";
    for (wchar_t wc : wstr) {
        std::string mb(MB_CUR_MAX, '\0');
        int ret = std::wctomb(&mb[0], wc);
        std::cout << "multibyte char " << mb << " is " << ret << " bytes\n";
    }
}
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 窄多字节编码
    std::wstring wstr = L"z\u00df\u6c34\U0001d10b"; // 或 L"zß水𝄋"
    print_wide(wstr);
}

输出:

shift sequences not used
multibyte char z is 1 bytes
multibyte char ß is 2 bytes
multibyte char 水 is 3 bytes
multibyte char 𝄋 is 4 bytes

参阅

将下一个多字节字符转换成宽字符
(函数)
给定状态,转换宽字符到其多字节表示
(函数)
[虚]
从 internT 转换字符串为 externT 转换字符串,如在写入文件时
(std::codecvt<InternT,ExternT,State> 的虚受保护成员函数)