标准格式说明
对于基本类型和字符串类型,格式说明基于 Python 中的格式说明。
格式说明的语法是:
填充与对齐 (可选) 正负号 (可选) # (可选) 0 (可选) 宽度 (可选) 精度 (可选) L (可选) 类型 (可选)
|
|||||||||
正负号、#
及 0
选项只有在使用整数或浮点显示类型时合法。
填充与对齐
填充与对齐 是一个可选的填充字符(可以是除 {
和 }
以外的任何字符),后随对齐 选项 <
、>
、^
之一。
如果未指定填充字符,则缺省为空格字符。对于 Unicode 编码的格式说明,填充字符必须对应于单个 Unicode 标量值。
对齐 选项的意义如下:
-
<
:强制格式化的实参对齐到可用空间开头,通过在格式化的实参的后面插入 n 个字符。这是使用非整数非浮点显示类型时的默认选项。 -
>
:强制格式化的实参对齐到可用空间末尾,通过在格式化的实参的前面插入 n 个字符。这是使用整数或浮点显示类型时的默认选项。 -
^
:强制格式化的实参在可用空间中央,通过在格式化的实参的前面插入 ⌊
⌋ 个字符,后面插入 ⌈n 2
⌉ 个字符。n 2
在所有情况下,n 是最小域宽(以 宽度 指定)和格式化的实参的预计宽度的差,或者在差小于 0 时是 0。
char c = 120; auto s0 = std::format("{:6}", 42); // s0 的值是 " 42" auto s1 = std::format("{:6}", 'x'); // s1 的值是 "x " auto s2 = std::format("{:*<6}", 'x'); // s2 的值是 "x*****" auto s3 = std::format("{:*>6}", 'x'); // s3 的值是 "*****x" auto s4 = std::format("{:*^6}", 'x'); // s4 的值是 "**x***" auto s5 = std::format("{:6d}", c); // s5 的值是 " 120" auto s6 = std::format("{:6}", true); // s6 的值是 "true "
正负号、# 与 0
正负号 选项可以是下列之一:
-
+
:指示应该对于非负数和负数都使用正负号。在非负数的输出值前插入+
号。 -
-
:指示应该仅对于负数使用正负号(这是默认行为)。 - 空格:指示应对非负数使用一个前导空格,而对负数使用负号。
负零被当作负数。
正负号 选项适用于浮点无穷大和 NaN。
double inf = std::numeric_limits<double>::infinity(); double nan = std::numeric_limits<double>::quiet_NaN(); auto s0 = std::format("{0:},{0:+},{0:-},{0: }", 1); // s0 的值是 "1,+1,1, 1" auto s1 = std::format("{0:},{0:+},{0:-},{0: }", -1); // s1 的值是 "-1,-1,-1,-1" auto s2 = std::format("{0:},{0:+},{0:-},{0: }", inf); // s2 的值是 "inf,+inf,inf, inf" auto s3 = std::format("{0:},{0:+},{0:-},{0: }", nan); // s3 的值是 "nan,+nan,nan, nan"
#
选项导致将代用形式 用于转换。
- 对于整数类型,使用二进制、八进制或十六进制显示类型时,代用形式会在有正负号字符(可以是空格)时将前缀(
0b
、0
或0x
)插入到输出值中正负号字符之后,否则将前缀插入到输出值之前。 - 对于浮点类型,代用形式导致转换有限值的结果始终含有小数点字符,即使它后面没有数位。正常情况下,小数点字符只有在它后面有数位时才会在转换结果出现。另外,对于
g
与G
转换,不会从结果移除尾随的零。
0
选项(在任何正负号或底之后)以前导零填充域到域宽,除了应用到无穷大或 NaN 时。如果 0
字符与对齐 选项一同出现,那么忽略 0
字符。
char c = 120; auto s1 = std::format("{:+06d}", c); // s1 的值是 "+00120" auto s2 = std::format("{:#06x}", 0xa); // s2 的值是 "0x000a" auto s3 = std::format("{:<06}", -42); // s3 的值是 "-42 "(因 < 对齐忽略 0)
宽度与精度
宽度 是一个正十进制数或嵌套的替换域({}
或 {
n }
)。它存在的情况下会指定最小域宽。
精度 是点(.
)后随非负十进制数或嵌套的替换域。此域指示精度或最大域大小。它只能用于浮点与字符串类型。
- 对于浮点类型,此域指定格式化精度。
- 对于字符串类型,它提供要复制到输出的字符串前缀的估计宽度(见下文)的上界。对于以 Unicode 编码的字符串,复制到输出的文本是整个扩展字素集群的,使得估计宽度不大于精度的最长前缀。
如果宽度 或精度 中使用嵌套的替换域,而对应的实参不是整数类型 (C++23 前)标准有符号或无符号整数类型 (C++23 起),为负,或对于宽度 为零,那么就会抛出 std::format_error 类型的异常。
float pi = 3.14f; auto s1 = std::format("{:10f}", pi); // s1 = " 3.140000" (宽度 = 10) auto s2 = std::format("{:{}f}", pi, 10); // s2 = " 3.140000" (宽度 = 10) auto s3 = std::format("{:.5f}", pi); // s3 = "3.14000" (精度 = 5) auto s4 = std::format("{:.{}f}", pi, 5); // s4 = "3.14000" (精度 = 5) auto s5 = std::format("{:10.5f}", pi); // s5 = " 3.14000" // (宽度 = 10,精度 = 5) auto s6 = std::format("{:{}.{}f}", pi, 10, 5); // s6 = " 3.14000" // (宽度 = 10,精度 = 5) auto b1 = std::format("{:{}f}", pi, 10.0); // 抛出:宽度不是整数类型 auto b2 = std::format("{:{}f}", pi, -10); // 抛出:宽度为负 auto b3 = std::format("{:.{}f}", pi, 5.0); // 抛出:精度不是整数类型
对于字符串类型,宽度定义为适合将它显示到终端的估计列位置个数。
就宽度计算目的,假设字符串用实现定义的编码。未指定宽度计算的方法,但对于以 Unicode 的字符串,实现应该估计字符串的宽度为它的扩展字素集群中首个码位的估计宽度之和。如果 Unicode 码位在下列范围内,那么估计宽度是 2,否则是 1:
- 任意 Unicode 属性
East_Asian_Width
具有值 Fullwidth (F
) 或 Wide (W
) 的代码点 - U+4DC0 – U+4DFF(易经六十四卦像)
- U+1F300 – U+1F5FF(杂项符号和象形文字)
- U+1F900 – U+1F9FF(补充符号和象形文字)
auto s1 = std::format("{:.^5s}", "🐱"); // s1 = ".🐱.." auto s2 = std::format("{:.5s}", "🐱🐱🐱"); // s2 = "🐱🐱" auto s3 = std::format("{:.<5.5s}", "🐱🐱🐱"); // s3 = "🐱🐱."
L(本地环境特定的格式化)
L
选项导致使用本地环境特定的形式。此选项仅对算术类型合法。
- 对于整数类型,本地环境特定形式会按照上下文的本地环境插入适合的数位组分隔字符。
- 对于浮点类型,本地环境特定形式会按照上下文的本地环境插入适合的数位组和基数分隔字符。
- 对于 bool 的文本表示,本地环境特定形式使用如同通过 std::numpunct::truename 或 std::numpunct::falsename 获得的字符串。
类型
类型 选项确定应该如何显示数据。
可用的字符串显示类型有:
- 无、
s
:复制字符串到输出。
|
(C++23 起) |
可用的 char、wchar_t 与 bool 以外的整数类型的整数显示类型有:
-
b
:二进制格式。如同通过调用 std::to_chars(first, last, value, 2) 产生输出。底前缀是0b
。 -
B
:同b
,但底前缀是0B
。 -
c
:复制字符 static_cast<CharT>(value) 到输出,其中 CharT 是格式字符串的字符类型。如果值不在CharT
的可表示值的范围中,那么就会抛出 std::format_error。 -
d
:十进制格式。如同通过调用 std::to_chars(first, last, value) 产生输出。 -
o
:八进制格式。如同通过调用 std::to_chars(first, last, value, 8) 产生输出。如果对应实参值非零,那么底前缀是0
,否则为空。 -
x
:十六进制格式。如同通过调用 std::to_chars(first, last, value, 16) 产生输出。底前缀是0x
。 -
X
:同x
,但对 9 以上的数字使用大写字母且底前缀是0X
。 - 无:同
d
。
可用的 char 和 wchar_t 表示类型有:
- 无、
c
:复制字符到输出。 -
b
、B
、d
、o
、x
、X
:使用值分别为 static_cast<unsigned char>(value) 或 static_cast<std::make_unsigned_t<wchar_t>>(value) 的整数表示类型。
|
(C++23 起) |
可用的 bool 表示类型有:
- 无、
s
:复制文本表示(true
或false
或本地环境特定形式)到输出。 -
b
、B
、c
、d
、o
、x
、X
:以值 static_cast<unsigned char>(value) 使用整数表示类型。
可用的浮点表示类型有:
-
a
:如果有指定精度,那么如同通过调用 std::to_chars(first, last, value, std::chars_format::hex, precision) 产生输出,其中 precision 是指定的精度,否则如同通过 std::to_chars(first, last, value, std::chars_format::hex) 产生输出。 -
A
:同a
,但对 9 以上的数字使用大写字母并用P
指示指数。 -
e
:如同通过调用 std::to_chars(first, last, value, std::chars_format::scientific, precision) 产生输出,其中 precision 是指定的精度,或者在未指定精度时是 6。 -
E
:同e
,但用E
指示指数。 -
f
、F
:如同通过调用 std::to_chars(first, last, value, std::chars_format::fixed, precision) 产生输出,其中 precision 是指定的精度,或者在未指定精度时是 6。 -
g
:如同通过调用 std::to_chars(first, last, value, std::chars_format::general, precision) 产生输出,其中 precision 是指定的精度,或者在未指定精度时是 6。 -
G
:同g
,但用E
指示指数。 - 无:如果有指定精度,那么如同通过调用 std::to_chars(first, last, value, std::chars_format::general, precision) 产生输出,其中 precision 为指定的精度;否则如同通过调用 std::to_chars(first, last, value) 产生输出。
对于小写表示类型,分别格式化无穷大和 NaN 为 inf
与 nan
。对于大写表示类型,分别格式化无穷大和 NaN 为 INF
与 NAN
。
可用的指针表示类型(也用于 std::nullptr_t)有:
- 无、
p
:如果定义了 std::uintptr_t,那么如同通过调用 std::to_chars(first, last, reinterpret_cast<std::uintptr_t>(value), 16) 产生输出,并添加前缀0x
到输出;否则输出由实现定义。
|
(C++26 起) |
格式化经转义字符和字符串字符或字符串可以在格式化时进行转义 ,适合用于调试或记录日志。 转义通过以下方式进行:
字符串的转义字符串表示会通过以上述方式对字符串中的代码单元序列进行转义来构造,并且用双引号包围结果。 字符的转义表示会通过以上述方式对它进行转义来构造,并且用单引号包围结果。 auto s1 = std::format("[{:?}]", "h\tllo"); // s1 的值:["h\tllo"] auto s2 = std::format("[{:?}]", "Спасибо, Виктор ♥!"); // s2 的值: // ["Спасибо, Виктор ♥!"] auto s3 = std::format("[{:?}] [{:?}]", '\'', '"'); // s3 的值:['\'', '"'] // 以下样例假定采用了 UTF-8 编码 auto s4 = std::format("[{:?}]", std::string("\0 \n \t \x02 \x1b", 9)); // s4 的值: // [\u{0} \n \t \u{2} \u{1b}] auto s5 = std::format("[{:?}]", "\xc3\x28"); // 非法 UTF-8 // s5 的值:["\x{c3}("] auto s6 = std::format("[{:?}]", "\u0301"); // s6 的值:["\u{301}"] auto s7 = std::format("[{:?}]", "\\\u0301"); // s7 的值:["\\\u{301}"] auto s8 = std::format("[{:?}]", "e\u0301\u0323"); // s8 的值:["ẹ́"] |
(C++23 起) |
注解
大多数情况下,这个语法与老式的 %
格式化类似,添加了 {}
并用 :
取代 %
。例如,'%03.2f' 可被翻译成 '{:03.2f}'。
功能特性测试宏 | 值 | 标准 | 功能特性 |
---|---|---|---|
__cpp_lib_format_uchar |
202311L | (C++20) (DR) |
格式化编码单元为无符号整数 |
缺陷报告
下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。
缺陷报告 | 应用于 | 出版时的行为 | 正确行为 |
---|---|---|---|
LWG 3721 | C++20 | 标准格式说明中不允许指定域宽为零 | 可以通过替换域指定 |
P2909R4 | C++20 | char 或 wchar_t 可能被格式化为范围外的无符号整数值 | 在这种格式化前将编码单元转换为对应的无符号类型 |