std::mbrlen

来自cppreference.com
< cpp‎ | string‎ | multibyte
在标头 <cwchar> 定义
std::size_t mbrlen( const char* s, std::size_t n, std::mbstate_t* ps);

给定当前转换状态 ps,确定首字节为 s 所指向的多字节字符的剩余字节大小。

此函数等价于对于某 std::mbstate_t 类型的隐藏对象 internal 的调用 std::mbrtowc(nullptr, s, n, ps ? ps : &internal),但它只求值表达式 ps 一次。

参数

s - 指向多字节字符串元素的指针
n - s 中能检验的字节数限制
ps - 指向保有转换状态的对象的指针

返回值

若下 n 个或更少字节完成空字符则为 0

完成合法多字节字符的字节数(1n 之间)。

若发生编码错误则为 (size_t)-1

若下 n 个字节为可能合法,而在检验全部 n 个字节后仍不完整的多字节字符的一部分,则为 (size_t)-2

示例

#include <clocale>
#include <cwchar>
#include <iostream>
#include <string>
 
int main()
{
    // 允许 mbrlen() 以 UTF-8 多字节编码工作
    std::setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 窄多字节编码
    std::string str = u8"水"; // 或 u8"\u6c34" 或 "\xe6\xb0\xb4"
    std::mbstate_t mb = std::mbstate_t();
    int len1 = std::mbrlen(&str[0], 1, &mb);
    if (len1 == -2) {
        std::cout << << str "的第一个字节是不完整的多字节字符 (mbrlen 返回 -2)\n";
    }
    int len2 = std::mbrlen(&str[1], str.size()-1, &mb);
    std::cout << str << " 的剩余 " << str.size()-1 << " 个字节"
              << "持有多字节字符的 " << len2 << " 个字节\n";
    std::cout << "尝试在初始转换状态中在 " << str
              << " 的中间调用 mbrlen() 返回 "
              << (int)mbrlen(&str[1], str.size(), &mb) << '\n';
 
}

输出:

水 的第一个字节是不完整的多字节字符 (mbrlen 返回 -2)
水 的剩余 2 个字节持有多字节字符的 2 个字节
尝试在初始转换状态中在 水 的中间调用 mbrlen() 返回  -1

参阅

给定状态,转换下个多字节字符为宽字符
(函数)
返回下一个多字节字符中的字节数
(函数)
计算转换成给定的 InternT 缓冲区会消耗的 ExternT 字符串长度
(std::codecvt<InternT,ExternT,StateT> 的虚受保护成员函数)