17370845950

C++二进制文件读写常见错误及解决方案【避坑指南】
根本原因是未指定std::ios::binary标志,导致Windows下文本模式自动转换\r\n和遇0x1A提前终止;还需避免混用C/C++ I/O、结构体直接读写、忽略异常及文本/二进制模式混用。

std::ifstream 读二进制文件却读出乱码或数据截断

根本原因通常是没加 std::ios::binary 标志。Windows 下默认文本模式会把 \r\n 自动转成 \n,还可能在遇到 0x1A(EOF 字符)时提前终止读取。

  • 务必在打开文件时显式指定 std::ios::binary
    std::ifstream file("data.bin", std::ios::in | std::ios::binary);
  • 检查 file.is_open()file.good(),不要只依赖构造是否抛异常
  • 读取前用 file.seekg(0, std::ios::end); size_t len = file.tellg(); file.seekg(0); 获取真实字节长度,避免用 file.gcount() 误判

fread / fwritestd::streambuf 混用导致缓冲错乱

C 风格 I/O 和 C++ 流共用同一文件描述符但各自维护缓冲区,混用会跳过或重复读写部分字节,尤其在非全缓冲模式下极难复现。

  • 一个文件对象只用一种风格:要么全程用 fread/fwrite,要么全程用 read()/write()>>/
  • 若必须桥接,调用 file.rdbuf()->pubsync()(C++流)或 fflush()(C流)强制刷缓存,再切换
  • 注意 std::ofstream 默认不缓冲二进制写入,频繁小写建议手动 file.rdbuf()->pubsetbuf(buf, size)

结构体直接 read() 写入后跨平台/编译器读取失败

结构体内存布局受对齐(#pragma pack)、字段顺序、大小端、成员类型(如 bool 占几个字节)影响,不同平台或编译选项下 sizeof(MyStruct) 可能不同。

  • 禁止直接 file.re

    ad(reinterpret_cast(&s), sizeof(s))
    传输结构体
  • 改用序列化:逐字段读写,或用 memcpy + 显式字节序转换(如 htons)处理整数
  • 若必须紧凑二进制,统一用 #pragma pack(1) 并静态断言:
    static_assert(sizeof(MyStruct) == 12, "Struct layout changed");
  • 写入前用 file.write(...) 后立即检查 file.gcount() == expected_bytes

未处理 std::ios_base::failure 异常导致程序崩溃

默认情况下 std::ifstream/std::ofstream 不抛异常,但一旦开启 exceptions(std::ios_base::failbit | std::ios_base::badbit)read() 失败、磁盘满、权限不足等都会 throw,没 catch 就 terminate。

  • 开启异常前确认你真要它:多数场景用 if (!file) { /* handle */ } 更轻量
  • 若开启,必须包围所有 I/O 操作:
    file.exceptions(std::ios_base::failbit | std::ios_base::badbit);
    try {
        file.read(buf, len);
    } catch (const std::ios_base::failure& e) {
        // 注意:e.what() 可能不包含具体错误码
        int err = errno; // 需在 catch 块内立刻读,errno 可能被后续调用覆盖
    }
  • std::ios_base::eofbit 不触发异常,需单独用 file.eof() 判断是否读到末尾

实际项目里最常被忽略的是:二进制读写路径中夹杂了任何文本操作(比如用 std::getline 读配置后再切回二进制读),哪怕只调用一次,也会让流进入文本状态并污染后续行为。