std::wstring_convert<Codecvt,Elem,Wide_alloc,Byte_alloc>::from_bytes

来自cppreference.com
定义于头文件 <locale>
wide_string from_bytes( char byte );
(1)
wide_string from_bytes( const char* ptr );
(2)
wide_string from_bytes( const byte_string& str );
(3)
wide_string from_bytes( const char* first, const char* last);
(4)

用构造中时提供的 codecvt 平面,进行多字节到宽转换。

1) 转换 byte 为 wide_string ,如同它是长为 1 的字符串。

2) 转换始于 ptr 所指向字符的空终止多字节字符序列为 wide_string 。

3) 转换窄字符串 str 为 wide_string 。

4) 转换窄多字节字符序列 [first, last) 为 wide_string 。

所有情况下,转换以初始迁移状态起始,除非提供了非初始起始状态给此 wstring_convert 的构造函数。记忆转换的字符数和转换状态的终值,并且能以 state()converted() 访问它们。

返回值

含有多字节到宽转换结果的 wide_string 对象。若转换失败,且有用户提供的宽错误字符串提供给此 wstring_convert 的构造函数,则返回该宽错误字符串。

异常

若此 wstring_convert 不以用户提供的宽错误字符串构造,则在转换失败时抛出 std::range_error

示例

#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
 
int main()
{
    std::string utf8 =  u8"z\u00df\u6c34\U0001d10b"; // 或 u8"zß水𝄋"
                        // 或 "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
 
    // UTF-8 / UTF-16 标准转换平面
    std::u16string utf16 = std::wstring_convert<std::codecvt_utf8_utf16<char16_t>, char16_t>{}.from_bytes(utf8.data());
    std::cout << "UTF16 conversion produced " << utf16.size() << " code units:\n";
    for (char16_t c : utf16)
        std::cout << std::hex << std::showbase << c << '\n';
 
    // UTF-8 / UTF-32 标准转换平面
    std::u32string utf32 = std::wstring_convert<std::codecvt_utf8<char32_t>, char32_t>{}.from_bytes(utf8);
    std::cout << "UTF32 conversion produced " << std::dec << utf32.size() << " code units:\n";
    for (char32_t c : utf32)
        std::cout << std::hex << std::showbase << c << '\n';
}

输出:

UTF16 conversion produced 5 code units:
0x7a
0xdf
0x6c34
0xd834
0xdd0b
UTF32 conversion produced 4 code units:
0x7a
0xdf
0x6c34
0x1d10b

参阅

转换宽字符串为字符串
(公开成员函数)
给定状态,转换窄多字节字符串到宽字符串
(函数)
[虚]
从 externT 转换字符串为 internT ,如在从文件读取时
(std::codecvt<InternT,ExternT,State> 的虚受保护成员函数)