C/C++ static关键字详解

C 语言中的 static
C++ 语言中的 static

C 语言中的 `static`

在 C 语言中，static 是一个非常核心但容易被误解的关键字，它在不同位置使用时，语义完全不同。可以一句话概括：

static 的本质作用：限制作用域 + 延长生命周期

下面我们分为三种场景来讨论 static 的具体含义。

修饰局部变量（函数内部）

示例：

void func() {
    static int count = 0; // 静态局部变量
    count++;
    printf("count: %d\n", count);
}

当我们在函数内部使用 static 修饰局部变量时，该变量的作用域仍然局限于函数内部，但其生命周期被延长至整个程序运行期间。换句话说，函数调用结束后，变量不会被销毁，而是保留其值，直到下一次函数调用。

特性	普通局部变量	static 局部变量
作用域	仅函数内部	仅函数内部
生命周期	每次调用创建	整个程序运行期
存储位置	栈	全局区 / 静态区
是否初始化	不自动	自动初始化为 0

在底层实现上，static 局部变量存储在程序的全局区（也称为静态区），而不是栈上。这意味着它们在程序启动时就被分配内存，并在程序结束时才释放。

之前我们讲到 ELF 文件格式时提到过，ELF 文件提供了 _start 的相对地址，这个地址是一个程序真正的入口，运行时会通过基址确定 _start 的实际地址，CPU 会跳转到 _start 处开始执行程序。在 _start 处，运行时会完成一些初始化工作，其中就包括对全局区和静态区的初始化。

execve
 └─ 内核加载 ELF
     ├─ 建立虚拟地址空间
     ├─ 映射 text / rodata / data / bss
     ├─ 创建用户栈（argv / envp / auxv）
     └─ 跳转到 _start
          └─ __libc_start_main
               ├─ 初始化 libc
               ├─ 调用 .init / 构造函数
               ├─ 调用 main
               └─ 注册析构函数

而在这个阶段，static 局部变量会被初始化为零值（如果没有显式初始化的话）。这就是为什么 static 局部变量在第一次使用前已经有一个确定的值。

也就是说，在 main 函数开始执行之前，static 局部变量已经被分配内存并初始化完毕了，且 static 局部变量被放在了全局区 / 静态区。

所以说，所谓的局部变量，其实只是作用域局限于函数内部而已，生命周期和存储位置已经和普通的局部变量完全不同了。它的局部性只是体现在作用域上，而不是生命周期和存储位置上。局部性是依靠编译器来实现的，编译器会确保只有在函数内部才能访问该变量。如果愿意，编译器完全可以将 static 局部变量提升为全局变量，只不过加上一个前缀来防止命名冲突罢了。

修饰全局变量（文件作用域）

示例：

static int global_var = 42; // 静态全局变量

当 static 用于修饰全局变量时，它的作用是将该变量的作用域限制在定义它的文件内，防止其他文件访问该变量。这种用法主要用于实现模块化编程，避免命名冲突。

特性	普通全局变量	static 全局变量
作用域	整个程序	当前源文件
链接属性	external	internal
是否可被 extern	是	❌ 否

底层视角，全局静态变量和局部静态变量一样，都是存储在全局区 / 静态区的，生命周期也是整个程序运行期间。所以说，运行阶段，系统是完全不知道这个变量是 static 还是普通全局变量的，区别只在于编译阶段，编译器会根据 static 关键字来限制该变量的链接属性为 internal，从而防止其他文件访问它。

修饰函数（文件作用域）

示例：

static void helper_function() {
    // 只能在当前文件中调用
}

当 static 用于修饰函数时，它的作用是将该函数的作用域限制在定义它的文件内，防止其他文件调用该函数。这种用法同样用于实现模块化编程，避免命名冲突。

函数类型	链接属性
普通函数	external
static 函数	internal

这是 C 语言实现模块化编程的一种常见手段，同时也是唯一手段，通过将不需要暴露给外部的函数声明为 static，可以有效地隐藏实现细节，减少命名冲突的风险。

使用位置	作用
函数内部变量	延长生命周期
全局变量	限制可见性（文件级私有）
函数	限制可见性（文件级私有）

C++ 语言中的 `static`

相比 C 语言，C++ 对 static 关键字的使用更加广泛和复杂，除了继承自 C 语言的用法外，C++ 还引入了类静态成员的概念。

初始化模型彻底不同

在 C 语言中，只有静态初始化，因此 static 变量：

编译器可确定
会被写进 ELF 文件的 .data 或 .bss 段
main 函数开始前完成初始化
不存在运行时初始化

但是在 C++ 中，static 变量除了静态初始化，还可能涉及动态初始化：

static std::string s("hello");
static int y = foo();

这一步：

必须生成运行时代码
不能在 ELF 装载时完成
初始化顺序变成了语言规范的一部分

函数内部 `static` 的行为

在 C++ 中，函数内部的 static 变量如果涉及动态初始化，编译器会生成额外的代码来确保该变量在第一次使用时被正确初始化。这通常通过一个标志变量来实现，确保初始化代码只执行一次。在 C++11 及以后的标准中，引入了线程安全的初始化机制，确保在多线程环境下，static 局部变量的初始化也是安全的。

在这背后，编译器会生成类似如下的伪代码：

if (!guard_initialized) {
    lock();
    if (!guard_initialized) {
        new (&s) std::string("hello");
        guard_initialized = true;
        register_destructor(s);
    }
    unlock();
}

这就是所谓的：

guard variable（守卫变量，即用于确保静态变量只初始化一次的标志）
magic statics（魔法静态变量，即编译器为实现线程安全的静态局部变量初始化所生成的代码）
一次性初始化（确保初始化代码只执行一次）

析构动作

对于动态初始化的 static 变量，C++ 还会在程序结束时自动调用其析构函数，以释放资源。这是通过注册析构函数来实现的，编译器会在初始化时将析构函数注册到一个全局的析构函数列表中，程序退出时会依次调用这些析构函数。

在上面的伪代码中，register_destructor(s); 就是完成这一功能的关键步骤。这一步本质上是将该静态变量注册到一个全局的析构函数列表中，以确保在程序结束时能够正确调用其析构函数，释放资源。这个全局的析构函数列表通常由运行时库维护，确保所有注册的析构函数在程序退出时被调用。我们可以将其理解为回调机制的一种应用。

类静态成员

C++ 引入了类静态成员的概念，允许在类中定义静态变量和静态函数。类静态成员属于类本身，而不是类的某个实例，因此它们在所有实例之间共享。

而类中的静态成员本质上和全局静态变量类似，都是存储在全局区 / 静态区的，运行时在系统看来和全局静态变量一样，生命周期也是整个程序运行期间。类静态成员的初始化和访问方式与普通静态变量类似，但需要通过类名进行访问。

类静态成员函数

类静态成员函数也是属于类本身的函数，可以在没有类实例的情况下调用。它们不能访问类的非静态成员，因为它们没有 this 指针。类静态成员函数通常用于实现与类相关但不依赖于具体实例的功能。其和类静态函数的区别在于，类静态成员函数是类的一部分，可以访问类的静态成员，而普通的静态函数则不属于任何类，不能访问类的成员。

时代变了，模块化不再强求 static

在现代 C++ 中，随着命名空间和匿名命名空间的引入，模块化编程变得更加灵活和强大。命名空间允许我们将相关的代码组织在一起，避免命名冲突，而不需要依赖 static 关键字来限制作用域。

比如以下场景：

static int global_var = 42; // 静态全局变量

而我们在现代 C++ 中更推荐使用命名空间：

namespace {
    int global_var = 42; // 匿名命名空间中的变量，作用域限于当前文件
}

调用时：

void func() {
    global_var++;
    std::cout << "global_var: " << global_var << std::endl;
}

和使用 static 修饰的全局变量效果是一样的，但更符合现代 C++ 的编程风格。

相关推荐