std::mbstowcs

来自cppreference.com
< cpp‎ | string‎ | multibyte
在标头 <cstdlib> 定义
std::size_t mbstowcs( wchar_t* dst, const char* src, std::size_t len );

转换来自首元素为 src 所指向的数组的多字节字符串到其宽字符表示。被转换的字符存储于 dst 所指向数组的相继元素。写入目标数组的宽字符数不多于 len

如同以调用 std::mbtowc 转换每个字符,除了 mbtowc 转换状态不受影响。若满足下列条件则转换停止:

  • 转换并存储了多字节空字符。
  • 遇到(当前 C 本地环境中的)非法多字节字符。
  • 本要存储的下个宽字符会超出 len

注解

大多数实现中,此函数在处理过字符串时更新 std::mbstate_t 类型的全局静态对象,而且不能为两个线程所同时调用,这种情况应该用 std::mbsrtowcs

POSIX 指定一个常见扩展:若 dst 是空指针,则此函数返回假设转换则写入 dst 的宽字符数。类似行为对于 std::mbsrtowcs 是标准。

参数

dst - 指向将存储宽字符串的宽字符数组的指针
src - 指向要转换的空终止多字节字符串的首元素的指针
len - dst 所指向的数组中的可用宽字符数

返回值

成功时,返回目标数组的宽字符数,不含终止符 L'\0'

转换错误时(若遇到非法多字节字符),返回 static_cast<std::size_t>(-1)

示例

#include <clocale>
#include <cstdlib>
#include <iostream>
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    std::wcout.imbue(std::locale("en_US.utf8"));
    const char* mbstr = "z\u00df\u6c34\U0001f34c"; // or u8"zß水🍌"
                        // or "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9f\x8d\x8c";
    wchar_t wstr[5];
    std::mbstowcs(wstr, mbstr, 5);
    std::wcout << "宽字符串: " << wstr << '\n';
}

输出:

宽字符串: zß水🍌

参阅

给定状态,转换窄多字节字符串到宽字符串
(函数)
转换宽字符串为窄多字节字符串
(函数)
[虚]
将字符串从 ExternT 转换到 InternT,例如在从文件读取时
(std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数)