代码收藏家技术教程 2025-05-14

Python字符串解析利器：struct模块中的unpack_from方法详解，包括fmt格式与offset偏移量使用指南

struct.unpack_from() 是 Python 标准库 struct 模块中的一个函数，用于从字节序列中按照指定的格式解析数据。它与 struct.unpack() 类似，但允许你从字节序列的特定偏移量（offset）开始解析，而不是从头开始。

语法

struct.unpack_from(fmt, buffer, offset=0)

fmt：格式化字符串，定义了如何解析数据。

buffer：包含数据的字节序列（通常是 bytes 或 bytearray）。

offset：从字节序列的哪个位置开始解析，默认为 0。

返回值：解析后的值（通常是一个元组）。

参数解释

(1) 格式化字符串 (`fmt`)

格式化字符串定义了如何解析字节序列中的数据。常见的格式字符包括：

<：小端模式（Little-endian）小端模式意味着多字节数据的低位字节存储在内存的低地址处。

>：大端模式（Big-endian）。

?：表示布尔值（True 或 False），占用 1 字节。

=：根据系统默认的字节序。

B：表示无符号字节（unsigned char），占用 1 字节，范围是 [0, 255]。

I：表示无符号整数（unsigned int），占用 4 字节，范围是 [0, 4294967295]

H：无符号短整数（2 字节）。

b：有符号字节（1 字节）。

i：有符号整数（4 字节）。

f：浮点数（4 字节）。

d：双精度浮点数（8 字节）。

更多格式字符可以参考 Python 官方文档。

(2) `payload`

payload 是你要解析的字节序列，通常是通过网络、文件或其他方式获取的二进制数据。

(3) `offset`

指定从字节序列的哪个字节开始解析。如果未指定，默认从第 0 个字节开始。

示例代码

假设我们有一个字节序列，并希望按照指定格式解析其中的数据：

示例 1：基本用法

import struct

# 假设 payload 是一个字节序列
payload = b'\x01\x00\x00\x00\x0A\xFF\x00\x00'

# 解析格式：<? B I
# - < 表示小端模式
# - ? 表示布尔
# - B 表示 1 字节无符号整数
# - I 表示 4 字节无符号整数
result = struct.unpack_from('<? B I', payload, offset=0)

print(result)  # 输出: (True, 1, 16777215)

解析过程：

<：表示小端模式。
?：表示布尔
B：解析第一个字节 \x01，结果为 1。
I：解析接下来的 4 字节 \x00\x00\x00\x0A，结果为 16777215（小端模式下，0x0A0000FF）。

示例 2：带偏移量的解析

import struct

payload = b'\xAA\xBB\xCC\xDD\xEE\xFF\x00\x00'

# 从第 2 个字节开始解析
result = struct.unpack_from('<B H', payload, offset=2)

print(result)  # 输出: (204, 65279)

解析过程：

从第 2 个字节（\xCC）开始解析。
B：解析 1 字节 \xCC，结果为 204。
H：解析接下来的 2 字节 \xDD\xEE，结果为 65279（小端模式下，0xEEDD）。

实际应用场景

场景 1：解析网络协议数据

在网络编程中，接收到的数据通常是二进制格式的字节流。可以使用 struct.unpack_from() 来解析这些数据。

import struct

# 假设这是接收到的网络数据包
data_packet = b'\x01\x00\x00\x00\x0A\xFF\x00\x00'

# 解析头部信息
header = struct.unpack_from('<B I', data_packet, offset=0)
print("Header:", header)  # 输出: Header: (1, 16777215)

# 解析后续数据
body = struct.unpack_from('<H', data_packet, offset=5)
print("Body:", body)  # 输出: Body: (255,)

场景 2：处理二进制文件

在读取二进制文件时，可以使用 struct.unpack_from() 提取文件中的特定字段。

import struct

# 假设这是一个二进制文件的内容
binary_data = b'\x00\x01\x02\x03\x04\x05\x06\x07'

# 从第 3 个字节开始解析两个无符号短整数
result = struct.unpack_from('<HH', binary_data, offset=2)
print(result)  # 输出: (772, 1029)

注意事项

字节对齐问题：
确保提供的字节序列长度足够长，否则会抛出 struct.error 异常。

struct.unpack_from('<I', b'\x01\x02')  # struct.error: unpack_from requires a buffer of at least 4 bytes

字节序问题：
明确指定字节序（如 < 或 >），以避免不同平台之间的兼容性问题。
动态偏移量：
如果需要解析多个字段，可以动态调整 offset 的值。

总结

struct.unpack_from() 是一个非常强大的工具，特别适合处理二进制数据流（如网络协议、文件格式等）。通过指定格式化字符串和偏移量，它可以灵活地解析复杂的数据结构。

如果你正在开发涉及二进制数据的应用程序（例如网络通信、嵌入式系统或文件解析），struct.unpack_from() 将是你的得力助手！

作者：斗转星移3

物联沃分享整理
物联沃-IOTWORD物联网 » Python字符串解析利器：struct模块中的unpack_from方法详解，包括fmt格式与offset偏移量使用指南

代码收藏家普通

分享到：

语法

参数解释

(1) 格式化字符串 (fmt)

(2) payload

(3) offset