位域

来自cppreference.com
< cpp‎ | language


 
 
C++ 语言
 
 

声明具有以位计的明确大小的类数据成员。相邻的位域成员可以打包成共享和跨过各个字节。

位域声明是使用下列声明符的类数据成员声明

标识符 (可选) 属性 (可选) : 大小 (1)
标识符 (可选) 属性 (可选) : 大小 花括号或等号初始化器 (2) (C++20 起)

位域的类型声明语法声明说明符序列 引入。

属性 - (C++11 起) 任意数量属性的序列
标识符 - 被声明的位域名。名字是可选的:无名位域引入指定数量的填充位
大小 - 值大于或等于零的整型常量表达式。大于零时,这是位域将占有的位数。零值只能用于无名位域并具有特殊含义
花括号或等号初始化器 - 此位域所使用的默认成员初始化器

解释

位域的类型只能是整型或(可有 cv 限定的)枚举类型,无名位域不能声明为具有有 cv 限定的类型。

位域不能是静态数据成员

没有位域纯右值:左值到右值转换始终生成位域底层类型的对象。

位域中的位数设置它能保有的值的极限:

#include <iostream>
 
struct S
{
    // 三位的无符号位域,允许的值有 0...7
    unsigned int b : 3;
};
 
int main()
{
    S s = {6};
 
    ++s.b; // 在位域中存储值 7
    std::cout << s.b << '\n';
 
    ++s.b; // 值 8 不适合此位域
    std::cout << s.b << '\n'; // 正式来说是由实现定义的行为,通常为 0
}

可能的输出:

7
0

多个相邻位域通常打包在一起(尽管此行为由实现定义):

#include <bit>
#include <cstdint>
#include <iostream>
 
struct S
{
    // 通常会占用 2 个字节:
    unsigned char b1 : 3; // 前 3 位(第 1 个字节)为 b1
    unsigned char    : 2; // 下 2 位(第 1 个字节)被跳过为未使用
    unsigned char b2 : 6; // 6 位给 b2 - 并不适于第 1 个字节 => 开始第 2 个
    unsigned char b3 : 2; // 2 位给 b3 - 接下来(即最后 2)位在第 2 个字节
};
 
int main()
{
    std::cout << sizeof(S) << '\n'; // 通常打印 2
 
    S s;
    // 设置各域为可区分的值
    s.b1 = 0b111;
    s.b2 = 0b101111;
    s.b3 = 0b11;
 
    // 显式 S 中各域的布局
    auto i = std::bit_cast<std::uint16_t>(s);
    // 通常打印 1110000011110111
    // 分解为: \_/\/\_/\____/\/
    //          b1 u a   b2  b3
    // 其中 "u" 标记结构体中未使用的 :2,而 "a" 标记由编译器添加用以字节对齐下一个域的填充位。
    // 发生字节对齐是因为 b2 的类型被声明为了 unsigned char;
    // 如果 b2 声明为 uint16_t 则将不会有 "a",b2 将紧挨 "u"。
    for (auto b = i; b; b >>= 1) // 按 LSB 先序打印
        std::cout << (b & 1);
    std::cout << '\n';
}

可能的输出:

2
1110000011110111

特殊的零大小无名位域可用于强行打破填充。它指定下个位域在它的分配单元的开始处开始:

#include <iostream>
 
struct S
{
    // 通常会占用 2 个字节:
    // 3 位:b1 的值
    // 5 位:不使用
    // 2 位:b2 的值
    // 6 位:不使用
    unsigned char b1 : 3;
    unsigned char :0; // 开始新字节
    unsigned char b2 : 2;
};
 
int main()
{
    std::cout << sizeof(S) << '\n'; // 通常打印 2
                                    // 若没有第 11 行打断填充则通常会打印 1
}

可能的输出:

2

如果位域所指定的大小大于它的类型的大小,那么值由类型所限制:std::uint8_t b : 1000; 仍只能保存 0 与 255 间的值。额外的位都是填充位

因为位域不一定在一个字节的开始处开始,所以不能取位域的地址。指向位域的指针和非 const 引用是不可行的。从位域初始化 const 引用时,将创建一个临时量(其类型是位域的类型),并以该位域的值复制初始化,而引用绑定到该临时量。

位域没有默认成员初始化器int b : 1 = 0;int b : 1 {0} 非良构。

(C++20 前)

在位域大小与默认初始化器有歧义的情况下,选择组成合法大小的最长记号序列:

int a;
const int b = 0;
 
struct S
{
    // 简单情况
    int x1 : 8 = 42;              // OK:"= 42" 是花括号或等号初始化器
    int x2 : 8 {42};              // OK:"{42}" 是花括号或等号初始化器
 
    // 有歧义
    int y1 : true ? 8 : a = 42;   // OK:不存在花括号或等号初始化器
    int y2 : true ? 8 : b = 42;   // 错误:不能赋值给 const int
    int y3 : (true ? 8 : b) = 42; // OK:"= 42" 是花括号或等号初始化器
    int z : 1 || new int{0};      // OK:不存在花括号或等号初始化器
};
(C++20 起)

注解

位域的下列性质由实现定义

  • 以范围外的值对有符号位域进行赋值或初始化,或对有符号位域进行自增越过其范围,所产生的值。
  • 任何关于类对象中位域的实际分配细节:
  • 例如,在某些平台上,位域不跨过字节,其他平台上会跨过
  • 还有,在某些平台上,位域从左到右打包,其他平台上从右到左

在 C 编程语言中,位域的宽度不能超过底层类型的宽度,并且未显式标为 signedunsignedint 位域是有符号还是无符号由实现定义。例如,C 中 int b:3; 可能有值域 0..7-4..3,但在 C++ 中只有后者。

缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

缺陷报告 应用于 出版时的行为 正确行为
CWG 324 C++98 未指明对位域的赋值的返回值是否也是位域 对可能返回左值的操作符添加位域说明
CWG 739 C++98 未显式声明为 signedunsigned 的位域由实现定义是否有符号 与底层类型一致
CWG 2229 C++98 无名位域可以声明为具有有 cv 限定的类型 已禁止
CWG 2511 C++98 位域类型不能有 cv 限定 位域的类型可以是有 cv 限定的枚举类型

引用

  • C++23 标准(ISO/IEC 14882:2024):
  • 11.4.10 Bit-fields [class.bit]
  • C++20 标准(ISO/IEC 14882:2020):
  • 11.4.9 Bit-fields [class.bit]
  • C++17 标准(ISO/IEC 14882:2017):
  • 12.2.4 Bit-fields [class.bit]
  • C++14 标准(ISO/IEC 14882:2014):
  • 9.6 Bit-fields [class.bit]
  • C++11 标准(ISO/IEC 14882:2011):
  • 9.6 Bit-fields [class.bit]
  • C++03 标准(ISO/IEC 14882:2003):
  • 9.6 Bit-fields [class.bit]
  • C++98 标准(ISO/IEC 14882:1998):
  • 9.6 Bit-fields [class.bit]

参阅

实现常量长度的位数组
(类模板)
节省空间的动态 bitset
(类模板特化)
位操纵工具 (C++20) 用来访问,操纵以及处理单独位和位序列的工具