std::wcsrtombs

来自cppreference.com
< cpp‎ | string‎ | multibyte
在标头 <cwchar> 定义
std::size_t wcsrtombs( char* dst,

                       const wchar_t** src,
                       std::size_t len,

                       std::mbstate_t* ps );

转换来自元素为 *src 所指向的宽字符序列为其窄多字节表示,始于 *ps 所描述的转换状态。若 dst 非空,则存储转换后的字符于 dst 所指向的字符数组的相接元素。不写入多于 len 个字节到目标数组。

如同以调用 std::wcrtomb 转换每个字符。若遇到下列条件则停止转换:

  • 转换并存储了空字符 L'\0'。此情况下存储的字节是反迁移序列(若需要)后随 '\0',设置 *src 为空指针并令 *ps 表示初始迁移状态。
  • 找到当前 C 本地环境中不对应合法字符的 wchar_t。设置 *src 指向首个未转换的宽字符。
  • 下个多字节字符将超出 len。设置 *src 指向首个未转换的宽字符。若 dst 为空指针则不检查此条件。

参数

dst - 指向窄字符数组的指针,其中将存储多字节字符
src - 指向指向空终止宽字符串首元素的指针的指针
len - dst 所指向的数组中可用的字节数
ps - 指向转换状态对象的指针

返回值

成功时,返回写入首元素为 dst 所指向的字符数组的字节数(包含任何迁移序列,但不包含终止 '\0')。若 dst 为空指针,则返回本会写入的字节数。

转换错误时(若遇到非法宽字符),返回 static_cast<std::size_t>(-1),存储 EILSEQerrno,并令 *ps 留在未指定状态。

示例

#include <clocale>
#include <cwchar>
#include <iostream>
#include <string>
#include <vector>
 
void print_wide(const wchar_t* wstr)
{
    std::mbstate_t state = std::mbstate_t();
    std::size_t len = 1 + std::wcsrtombs(nullptr, &wstr, 0, &state);
    std::vector<char> mbstr(len);
    std::wcsrtombs(&mbstr[0], &wstr, mbstr.size(), &state);
    std::cout << "多字节字符串: " << &mbstr[0] << '\n'
              << "包括 '\0' 的长度: " << mbstr.size() << '\n';
}
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 窄多字节编码
    const wchar_t* wstr = L"z\u00df\u6c34\U0001d10b"; // 或 L"zß水𝄋"
    print_wide(wstr);
}

输出:

多字节字符串: zß水𝄋
包括 '\0' 的长度: 11

参阅

给定状态,转换宽字符到其多字节表示
(函数)
给定状态,转换窄多字节字符串到宽字符串
(函数)
[虚]
将字符串从 InternT 转换到 ExternT,例如在写入文件时
(std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数)