std::vscanf, std::vfscanf, std::vsscanf
在标头 <cstdio> 定义
|
||
int vscanf( const char* format, std::va_list vlist ); |
(1) | (C++11 起) |
int vfscanf( std::FILE* stream, const char* format, std::va_list vlist ); |
(2) | (C++11 起) |
int vsscanf( const char* buffer, const char* format, std::va_list vlist ); |
(3) | (C++11 起) |
从各种源读取数据,按照 format 判读并存储结果到 vlist 所定义的位置。
参数
stream | - | 要读取的输入文件流 |
buffer | - | 指向要读取的空终止字符串的指针 |
format | - | 指向空终止字符串的指针,指定如何读取输入 |
vlist | - | 含有接收实参的可变参数列表 |
格式字符串由下列内容组成
- 非空白多字节字符,除了
%
:每个格式字符串中的这种字符处理一个来自输入流的完全相同的字符,或若它与流的下个字符比较不相等则导致函数失败。 - 空白字符:任何格式字符串中的单个空白字符处理所有来自输入的可用连续空白字符(如同通过于循环中调用 isspace 确定)。注意,格式字符串中 "\n"、" "、"\t\t" 或其他空白无区别。
- 转换指示:每个转换指示拥有下列格式:
- 引入用 % 字符
- (可选)赋值抑制字符 *。若存在此选项,则此函数不将结果赋值给任何接收用实参。
- (可选)指定最大字段宽度的整数数字(大于零),即函数进行在当前转换指示所指定的转换时,允许处理的最大字符数。注意若不提供宽度,则 %s 和 %[ 可能导致缓冲区溢出。
- (可选)指定接收实参大小的长度修饰符,即实际目标类型。这影响转换准确性和溢出规则。默认目标类型对每个转换类型有所不同(见下表)。
- 转换格式指示符。
下列格式指示符可用:
转换 指示符 |
解释 | 实参类型 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
长度修饰符 →
|
hh
(C++11) |
h
|
(无) | l
|
ll
(C++11) |
j
(C++11) |
z
(C++11) |
t
(C++11) |
L
| |
%
|
匹配字面 % 。
|
不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 |
c
|
若使用了宽度指示符,则匹配恰好宽度个字符(该实参必须是指向有充足空间的数组的指针)。不同于 %s 和 %[ ,它不会在数组后附加空字符。 |
不适用 | 不适用 | char* |
wchar_t* |
不适用 | 不适用 | 不适用 | 不适用 | 不适用 |
s
|
若使用宽度指示符,则至多匹配宽度个字符,或匹配到首个提前出现的空白符前。总是在匹配的字符后存储一个空字符(故实参数组必须有至少宽度 +1个字符的空间)。 | |||||||||
[ 集合]
|
若集合的首字符是 | |||||||||
d
|
该数的格式同 strtol() 以值 10 为 |
signed char* 或 unsigned char* |
signed short* 或 unsigned short* |
signed int* 或 unsigned int* |
signed long* 或 unsigned long* |
signed long long* 或 unsigned long long* |
intmax_t* 或 uintmax_t* |
size_t* |
ptrdiff_t* |
不适用 |
i
|
该数的格式同 strtol() 以值 0 为 | |||||||||
u
|
该数的格式同 strtoul() 以值 10 为 | |||||||||
o
|
该数的格式同 strtoul() 以值 8 为 | |||||||||
x , X
|
该数的格式同 strtoul() 以值 16 为 | |||||||||
n
|
不消耗输出。不增加赋值计数。若此指示符拥有赋值抑制运算符,则行为未定义。 | |||||||||
a , A (C++11)e , E f , F g , G
|
该数的格式同 strtof() 所期望者。 |
不适用 | 不适用 | float* |
double* |
不适用 | 不适用 | 不适用 | 不适用 | long double* |
p
|
|
不适用 | 不适用 | void** |
不适用 | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 |
对于每个异于 n 的转换指示符,不超过任何指定字段宽度,且要么恰好是转换指示符所期待,要么是其所期待的前缀的最长输入字符序列,即是从流中消耗的内容。此消耗序列后的首个字符若存在,则保持未读取。若被消耗序列长度为零,或被消耗序列不能转换成上面所指定的项目,则发生匹配失败,除非遇到文件尾、编码错误,或阻止从流输入的读取错误,此情况下此为输入失败。
所有异于 [、c 和 n 的转换指示符,在尝试分析输入前消耗并舍弃所有前导空白字符(如同以调用 isspace 来确定)。这些被消耗的字符不计入指定的最大字段宽度。
转换指示符 lc、ls 和 l[ 进行多字节到宽字符转换,如同如同在转换首字符前,通过用初始化到零的 mbstate_t 对象调用 mbrtowc()。
转换指示符 s 与 [ 始终在匹配字符之后存储一个空字符。目标数组的大小必须至少比指定字段宽度大一。未指定目标数组大小时,对 %s 或 %[ 的使用,与 std::gets 同样不安全。
定宽整数类型(int8_t
等)的正确的转换指示定义于头文件 <cinttypes> (虽然 SCNdMAX、SCNuMAX 等就是 %jd、%ju 等的别名)。
在每个转换指示符后有一个序列点;这允许存储多个字段到同一“池”变量中。
在分析以无数字指数为结尾的不完整浮点值,如以转换指示符 %f 分析 "100er" 时,消耗序列 "100e" (可能为合法浮点数的最长前缀),并导致匹配错误(被消耗序列不能转换成浮点数),而留下 "r"。某些既存实现不遵守此规则并回滚,通过消耗 "100" 而留下 "er",例如 glibc 漏洞 1765。
返回值
成功读取的实参个数,或若出现失败则为 EOF。
注解
所有这些函数调用 va_arg 至少一次,返回后 arg
的值不确定。这些函数不调用 va_end,而这必须由调用方进行。
示例
#include <cstdarg> #include <cstdio> #include <iostream> #include <stdexcept> void checked_sscanf(int count, const char* buf, const char *fmt, ...) { std::va_list ap; va_start(ap, fmt); if (std::vsscanf(buf, fmt, ap) != count) throw std::runtime_error("parsing error"); va_end(ap); } int main() { try { int n, m; std::cout << "Parsing '1 2'... "; checked_sscanf(2, "1 2", "%d %d", &n, &m); std::cout << "success\n"; std::cout << "Parsing '1 a'... "; checked_sscanf(2, "1 a", "%d %d", &n, &m); std::cout << "success\n"; } catch (const std::exception& e) { std::cout << e.what() << '\n'; } }
输出:
Parsing '1 2'... success Parsing '1 a'... parsing error
参阅
从 stdin、文件流或缓冲区读取有格式输入 (函数) | |
使用可变实参列表 打印有格式输出到 stdout、文件流或缓冲区 (函数) |