std::ctype<CharT>::narrow, do_narrow

来自cppreference.com
< cpp‎ | locale‎ | ctype
 
 
 
 
在标头 <locale> 定义
public:
char narrow( CharT c, char dflt ) const;
(1)
public:

const CharT* narrow( const CharT* beg, const CharT* end,

                     char dflt, char* dst ) const;
(2)
protected:
virtual char do_narrow( CharT c, char dflt ) const;
(3)
protected:

virtual const CharT* do_narrow( const CharT* beg, const CharT* end,

                                char dflt, char* dst ) const;
(4)
1,2) 公开成员函数,调用最终派生类的受保护虚成员函数 do_narrow 的对应重载。重载 (1) 会调用 do_narrow(c, dflt),重载 (2) 会调用 do_narrow(beg, end, dflt, dst)
3) 如果(可能为宽)的字符 c 能以单字节表示(例如 UTF-8 编码中的 ASCII 字符是单字节),那么转换它为多字节表示。如果这种转换不存在则返回 dflt
4) 对于字符数组 [begend) 中的每个字符,写入窄化字符(或在窄化失败时写入 dflt)到 dst 所指向的字符数组中的相继位置。

对于来自基本源字符集 (C++23 前)基本字符集 (C++23 前)的字符,窄化始终成功且始终可逆(通过调用 widen())。

如果窄化成功,那么它保持所有 is() 所知的字符分类类别。

  • is(m, c) || !ctc.is(m, do_narrow(c, dflt)) 对于任何具有 ctype<char> 刻面 ctcctype_base::maskm 的具名 ctype 类别都会是 true(除非 do_narrow 返回 dflt)。

窄化任何数字字符保证从结果减去字符字面量 '0' 的差等于原字符的数位值。

  • 即对于任何数字字符 c,表达式 (do_narrow(c, dflt) - '0') 始终求值为该字符的数字值。

参数

c - 要转换的字符
dflt - 转换失败时产生的默认值
beg - 指向要转换的字符数组中首字符的指针
end - 指向要转换的字符数组的尾后一位置的指针
dst - 指向要填充的字符数组首元素的指针

返回值

1,3) 窄化的字符,或窄化失败时返回 dflt
2,4) end

示例

#include <iostream>
#include <locale>
 
void try_narrow(const std::ctype<wchar_t>& f, wchar_t c)
{
    char n = f.narrow(c, 0);
    if (n)
        std::wcout << '\'' << c << "' 窄化为 " << +(unsigned char)n << '\n';
    else
        std::wcout << '\'' << c << "' 无法被窄化\n";
}
 
int main()
{
    std::locale::global(std::locale("en_US.utf8"));
    std::wcout.imbue(std::locale());
    std::wcout << std::hex << std::showbase << "在英语(美国)UTF-8 本地环境下:\n";
    auto& f = std::use_facet<std::ctype<wchar_t>>(std::locale());
    try_narrow(f, L'A');
    try_narrow(f, L'A');
    try_narrow(f, L'ě');
 
    std::locale::global(std::locale("cs_CZ.iso88592"));
    auto& f2 = std::use_facet<std::ctype<wchar_t>>(std::locale());
    std::wcout << "在捷克语 ISO-8859-2 本地环境下:\n";
    try_narrow(f2, L'A');
    try_narrow(f2, L'A');
    try_narrow(f2, L'ě');
}

输出:

在英语(美国)UTF-8 本地环境下:
'A' 窄化为 0x41
'A' 无法被窄化
'ě' 无法被窄化
在捷克语 ISO-8859-2 本地环境下:
'A' 窄化为 0x41
'A' 无法被窄化
'ě' 窄化为 0xec

缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

缺陷报告 应用于 出版时的行为 正确行为
LWG 126 C++98 1. 表示可逆性的代码是 do_widen(do_narrow(c), 0) == c
2. 表示保持类别的代码是 is(m, c) || !ctc.is(m, do_narrow(c), dflt)
两者均已修正
LWG 153 C++98 narrow 只会调用重载 (4) 会调用对应重载

参阅

调用 do_widen
(公开成员函数)
窄化字符
(std::basic_ios<CharT,Traits> 的公开成员函数)
若可能,则窄化宽字符为单字节窄字符
(函数)