通信协议中的大小端究竟是什么?

网络 网络管理
在通信协议中,必须明确指定使用哪种字节序,以确保发送方和接收方能够正确地解释数据。否则,如果发送方使用大端而接收方使用小端(或反之),那么在数据传输过程中就可能会出现混乱。

在物联网应用开发中,从嵌入式工程拿到的通信协议中经常会看到标明大小端模式,那么大小端究竟是什么?

大小端序

在通信协议中,大小端(Endian)是一个重要的概念,涉及到多字节数据(如整数、浮点数等)在内存中的存储方式。大小端序决定了数据的高位字节(Most Significant Byte,MSB)和低位字节(Least Significant Byte,LSB)在内存地址中的排列顺序。对于跨平台通信和数据交换至关重要,因为不同的硬件平台可能采用不同的字节序。

  1. 「大端(Big Endian)」:高位字节存储在内存的低地址处,低位字节存储在内存的高地址处。例如,一个16位的整数0x1234在大端模式下,在内存中的表示是0x12 0x34。
  2. 「小端(Little Endian)」:低位字节存储在内存的低地址处,高位字节存储在内存的高地址处。对于同一个16位的整数0x1234,在小端模式下,在内存中的表示是0x34 0x12。

图片图片

在通信协议中,必须明确指定使用哪种字节序,以确保发送方和接收方能够正确地解释数据。否则,如果发送方使用大端而接收方使用小端(或反之),那么在数据传输过程中就可能会出现混乱。

一种常见的做法是在通信协议中明确指定字节序,无论发送方和接收方的软件硬件平台如何,都可以确保数据的正确解释。也可能需要在通信协议中添加一些特定的标记或元数据,来指示数据的字节序,接收方就可以根据这些标记来动态地调整其字节序解释方式。

图片图片

例如,许多网络协议(如TCP/IP)使用大端序,而x86和x86_64等Intel架构则采用小端序。当进行跨平台通信时,字节序的不匹配可能会导致问题,通常需要在发送和接收数据时转换字节序。

在编程中,有时需要编写特定的代码来处理字节序的转换,以确保数据的正确解释。例如,在C语言中,可以使用htonl、ntohl、htons、ntohs等函数来处理网络字节序和主机字节序之间的转换。这些函数名称中的"h"代表host(主机),"n"代表network(网络),"s"代表short(短整型),"l"代表long(长整型)。

端序转换

在Java中,进行端序转换可以直接使用ByteBuffer类。ByteBuffer支持大端序(Big Endian)和小端序(Little Endian),并且可以在运行时动态地改变字节序。

对于整数类型(如int、short等),可以使用ByteBuffer的order()方法来设置字节序,然后使用putInt()、getShort()等方法来读写数据。

import java.nio.ByteBuffer;
import java.nio.ByteOrder;

public class EndianConversion {
    public static void main(String[] args) {
        int data1 = 0x12345678;
        short data2 = 0x1234;

        // 使用ByteBuffer进行端序转换
        ByteBuffer buffer1 = ByteBuffer.allocate(6); // 分配足够的空间
        ByteBuffer buffer2 = ByteBuffer.allocate(6);
        // 设置为小端序并写入数据
        buffer1.order(ByteOrder.LITTLE_ENDIAN);
        buffer1.putInt(data1);
        
        buffer2.order(ByteOrder.LITTLE_ENDIAN);
        buffer2.putShort(data2);

        // 翻转到大端序并读取数据
        buffer1.flip(); // 准备从缓冲区读取数据
        buffer1.order(ByteOrder.BIG_ENDIAN);
        int bigEndian1 = buffer1.getInt();
        
        buffer2.flip();
        buffer2.order(ByteOrder.BIG_ENDIAN);
        short bigEndian2 = buffer.getShort();

        System.out.println("原int值: " + Integer.toHexString(data1));
        System.out.println("大端模式int值: " + Integer.toHexString(bigEndian1));
        System.out.println("原short值: " + Integer.toHexString(data2 & 0xFFFF));
        System.out.println("大端模式short值: " + Integer.toHexString(bigEndian2 & 0xFFFF));
    }
}

对于浮点类型(如float、double),同样可以使用ByteBuffer进行端序转换。

import java.nio.ByteBuffer;
import java.nio.ByteOrder;

public class FloatEndianConversion {
    public static void main(String[] args) {
        float data = 123.45f;

        // 使用ByteBuffer进行端序转换
        ByteBuffer buffer = ByteBuffer.allocate(4); // 分配足够的空间

        // 设置为小端序并写入数据
        buffer.order(ByteOrder.LITTLE_ENDIAN);
        buffer.putFloat(data);

        // 翻转到大端序并读取数据
        buffer.flip(); // 准备从缓冲区读取数据
        buffer.order(ByteOrder.BIG_ENDIAN);
        float bigEndian = buffer.getFloat();

        System.out.println("原float值: " + data);
        System.out.println("大端模式float值: " + bigEndian);
    }
}

浮点数的端序转换,实际上并不需要改变其内部位的顺序,IEEE 754标准定义了浮点数的格式,无论在哪个平台上,只要按照该标准解释,其值都是一致的。如果需要将浮点数以字节的形式存储或传输,并希望接收方以不同的字节序解释这些字节,那么就需要使用ByteBuffer进行转换。

在C语言中,对于端序转换,通常使用标准的库函数,这些函数允许开发者在网络字节序(大端序)和主机字节序之间进行转换。网络字节序是大端序,而主机字节序则取决于具体的硬件架构(可能是大端序或小端序)。

对于16位和32位整数,可以使用htons(host to network short)、ntohs(network to host short)、htonl(host to network long)和ntohl(network to host long)函数进行转换。

#include <stdio.h>
#include <arpa/inet.h>

int main() {
    uint16_t short_host_order = 0x1234;
    uint32_t long_host_order = 0x12345678;

    // 转换到网络字节序(大端序)
    uint16_t short_net_order = htons(short_host_order);
    uint32_t long_net_order = htonl(long_host_order);

    // 转换回主机字节序
    uint16_t short_back_to_host = ntohs(short_net_order);
    uint32_t long_back_to_host = ntohl(long_net_order);

    printf("Host order short: %04x\n", short_host_order);
    printf("Network order short: %04x\n", short_net_order);
    printf("Back to host order short: %04x\n", short_back_to_host);

    printf("Host order long: %08x\n", long_host_order);
    printf("Network order long: %08x\n", long_net_order);
    printf("Back to host order long: %08x\n", long_back_to_host);

    return 0;
}

对于浮点数,没有直接的端序转换函数,因为浮点数的表示包括指数和尾数部分,这些部分在内存中的存储方式复杂。通常,一种解决方案是将浮点数转换为整数类型(如uint32_t),然后进行端序转换,再转回浮点数。

#include <stdio.h>
#include <string.h>
#include <arpa/inet.h>

int main() {
    float f = 123.45f;
    uint32_t *int_ptr;
    uint32_t int_val;
    float f_net, f_back;

    // 将浮点数转换为整数
    memcpy(&int_val, &f, sizeof(f));

    // 转换到网络字节序
    int_val = htonl(int_val);

    // 将整数转换回浮点数
    memcpy(&f_net, &int_val, sizeof(f_net));

    // 转换回主机字节序
    int_val = ntohl(int_val);
    memcpy(&f_back, &int_val, sizeof(f_back));

    printf("Original float: %f\n", f);
    printf("Network order float: %f\n", f_net);
    printf("Back to host order float: %f\n", f_back);

    return 0;
}

示例中默认字节序是小端序。在实际应用中,可以通过__BYTE_ORDER__宏在GCC中检查字节序,在需要时才进行端序转换。对于浮点数的端序转换,需要注意IEEE 754标准对浮点数表示的影响,以及不同平台和编译器可能产生的差异。

责任编辑:武晓燕 来源: 沐雨花飞蝶
相关推荐

2011-02-16 16:13:40

Debian

2015-08-26 09:54:19

物联网

2015-09-29 09:47:14

2019-05-27 15:30:44

Node.jsJavaScript前端

2018-09-10 13:47:21

数据科学统计学决策

2012-05-28 22:49:50

PureView

2011-08-04 13:24:28

IT运维

2022-06-13 09:51:35

UWB超宽带无线载波通信技术

2020-07-08 08:09:08

边缘计算边缘云云平台

2014-07-28 08:28:38

Windows

2014-08-07 10:32:02

Windows微软

2009-07-30 14:43:30

认识BSM

2021-08-09 05:19:08

Provider 前端前端代码

2020-04-24 09:35:46

机器学习技术模型

2020-12-17 17:33:47

MLOps大数据数据

2012-09-17 09:52:20

云计算云存储公有云

2010-03-19 17:30:18

云计算

2022-10-19 12:23:50

缓存CDN外部缓存

2015-06-04 10:26:50

2021-03-08 21:44:33

以太坊区块链比特币
点赞
收藏

51CTO技术栈公众号